Teknologi Prompt Caching Anthropic Hemat Biaya Pengembang

https://www.facebook.com/pibitek

August 21, 2024 Govan

image origin: venturebeat

TL;DR

Teknologi prompt caching dari Anthropic dapat menghemat biaya pengembang.
Prompt caching dari Anthropic memungkinkan model mengingat konteks antara panggilan API.
Teknologi caching prompt dari Anthropic dapat meningkatkan kecepatan respons model.

pibitek.biz -Anthropic baru saja merilis teknologi prompt caching pada API-nya. Teknologi ini memungkinkan model untuk mengingat konteks antara panggilan API dan menghindari pengulangan prompt. Fitur ini sudah tersedia dalam versi beta publik pada Claude 3.5 Sonnet dan Claude 3 Haiku, namun dukungan untuk model Claude terbesar, Opus, masih dalam tahap pengembangan.

Teknologi prompt caching memungkinkan pengguna untuk menyimpan konteks yang sering digunakan dalam sesi mereka. Dengan demikian, pengguna dapat menambahkan informasi latar belakang tambahan tanpa meningkatkan biaya. Fitur ini sangat berguna dalam kasus-kasus di mana seseorang ingin mengirimkan sejumlah besar konteks dalam prompt dan kemudian merujuk kembali ke konteks tersebut dalam percakapan yang berbeda dengan model. Fitur ini juga memungkinkan pengembang dan pengguna lain untuk memperbaiki respons model dengan lebih baik.

Anthropic menyatakan bahwa pengguna awal telah melihat peningkatan kecepatan dan biaya yang signifikan dengan menggunakan teknologi prompt caching untuk berbagai kasus penggunaan, mulai dari menyertakan basis pengetahuan lengkap hingga contoh 100-shot dan menyertakan setiap putaran percakapan dalam prompt. Perusahaan tersebut juga menyatakan bahwa kasus penggunaan potensial termasuk mengurangi biaya dan latensi untuk instruksi panjang dan dokumen yang diunggah untuk agen percakapan, autocompletion kode yang lebih cepat, memberikan instruksi multiple kepada alat pencarian agen, dan menyertakan dokumen lengkap dalam prompt.

Salah satu keuntungan dari teknologi prompt caching adalah harga per token yang lebih rendah. Anthropic menyatakan bahwa menggunakan prompt yang disimpan dalam cache "jauh lebih murah" daripada harga token input dasar. Untuk Claude 3.5 Sonnet, menulis prompt untuk disimpan dalam cache akan dikenakan biaya $3,75 per 1 juta token (MTok), namun menggunakan prompt yang disimpan dalam cache akan dikenakan biaya $0,30 per MTok. Harga dasar input ke model Claude 3.5 Sonnet adalah $3/MTok, sehingga dengan membayar sedikit lebih banyak di awal, pengguna dapat mengharapkan penghematan 10 kali lipat jika menggunakan prompt yang disimpan dalam cache pada kesempatan berikutnya.

Pengguna Claude 3 Haiku akan dikenakan biaya $0,30/MTok untuk menyimpan prompt dalam cache dan $0,03/MTok saat menggunakan prompt yang disimpan. Namun, seperti yang diperhatikan oleh influencer AI Simon Willison di X, cache Anthropic hanya memiliki umur 5 menit dan diperbarui setiap kali digunakan. Tentu saja, ini bukan pertama kalinya Anthropic mencoba bersaing dengan platform AI lain melalui harga.

Sebelum peluncuran model Claude 3, Anthropic telah memotong harga tokennya. Sekarang, perusahaan tersebut sedang dalam "perlombaan ke bawah" melawan rival seperti Google dan OpenAI dalam menawarkan opsi harga rendah untuk pengembang pihak ketiga yang membangun di atas platformnya. Platform lain juga menawarkan versi caching prompt. Lamina, sistem inferensi LLM, menggunakan caching KV untuk mengurangi biaya GPU.

Dengan melihat forum pengembang OpenAI atau GitHub, akan muncul pertanyaan tentang bagaimana cara caching prompt. Caching prompt tidak sama dengan memori LLM. Misalnya, GPT-4o OpenAI menawarkan memori di mana model mengingat preferensi atau detail.

Namun, tidak menyimpan prompt dan respons aktual seperti caching prompt. Dalam beberapa kasus, caching prompt dapat membantu mengurangi biaya dan meningkatkan kecepatan respons model. Namun, perlu diingat bahwa cache hanya memiliki umur 5 menit dan diperbarui setiap kali digunakan.

Dalam beberapa tahun terakhir, teknologi AI telah berkembang pesat, dan perusahaan seperti Anthropic terus berinovasi untuk meningkatkan kinerja dan mengurangi biaya. Dengan teknologi prompt caching, Anthropic berharap dapat membantu pengembang dan pengguna lain untuk memperbaiki respons model dan mengurangi biaya. Dalam beberapa bulan terakhir, Anthropic telah merilis beberapa fitur baru, termasuk model Claude 3 dan teknologi prompt caching. Perusahaan tersebut terus berinvestasi dalam pengembangan teknologi AI dan berharap dapat membantu pengembang dan pengguna lain untuk mencapai tujuan mereka.

AI Bantu Putusin Klaim PengangguranAI Bantu Putusin Klaim Pengangguran

Nevada mau jadi negara pertama yang pake AI buat ngebantu cepetin proses pengambilan keputusan dalam kasus banding klaim pengangguran. Nevada State Department of Employment, Training, and Rehabilitation (DETR) setuju buat bayar Google $1.383.838 buat teknologi AI ini. Rencananya, AI ini bakal diluncurin dalam beberapa bulan ke depan. AI yang lagi {18/09,pibitek.biz}

BlockDAG, Crypto yang Membuat Kamu Kaya Raya dengan ROI 30,000x - the photo via: techbullion - pibitek.biz - Ethereum

BlockDAG, Crypto yang Membuat Kamu Kaya Raya dengan ROI 30,000xBlockDAG, Crypto yang Membuat Kamu Kaya Raya dengan ROI 30,000x

Crypto • BlockDAG memimpin dengan prediksi ROI 30,000x pada tahun 2030, membuatnya menjadi potensi game-changer dalam keuangan pribadi. Notcoin dan Mantle juga menarik perhatian,...

Rekam Gameplay Steam Langsung Dari Client - credit for: makeuseof - pibitek.biz - Aplikasi

Game • Rekam Gameplay Steam Langsung Dari ClientGame • Rekam Gameplay Steam Langsung Dari Client

Steam punya fitur rekam gameplay baru yang bisa diakses lewat Steam Overlay, kamu bisa rekam dan bagi video ke teman. Fitur ini masih tahap beta, tapi kamu bisa mulai pake sekarang, tinggal aktifkan Steam Beta di pengaturan. Fitur rekam gameplay...

The Witcher 4: Menjelajahi Misteri Dunia Baru - credit: digitaltrends - pibitek.biz - RPG

The Witcher 4: Menjelajahi Misteri Dunia BaruThe Witcher 4: Menjelajahi Misteri Dunia Baru

RPG – The Witcher 4 adalah game berikutnya di dunia The Witcher, tapi Geralt bukan fokus utamanya. The Witcher 4 kemungkinan hanya akan tersedia di PS5, Xbox Series X/S,...

Kontroversi Memoir Kim Porter dan Penarikan dari Amazon - the picture via: vibe - pibitek.biz - Sosmed

Kontroversi Memoir Kim Porter dan Penarikan dari AmazonKontroversi Memoir Kim Porter dan Penarikan dari Amazon

Manusia — Kontroversi buku "Kim's Lost Words" memunculkan pertanyaan tentang keaslian memoir Kim Porter dan tuduhan fitnah terhadap Al B. Sure! dan Sean "Diddy" Combs. Amazon menarik buku tersebut dari peredaran setelah menerima surat peringatan dari Al B....

Mainkan Game Kriket untuk Bantu Negaramu Menang di Piala Dunia T20 - credit: makeuseof - pibitek.biz - India

Mainkan Game Kriket untuk Bantu Negaramu Menang di Piala Dunia T20 — IndiaMainkan Game Kriket untuk Bantu Negaramu Menang di Piala Dunia T20 — India

Google mengundang kita untuk bermain game kriket Mini Cup di perangkat mobile. Kamu dapat membantu negara kamu memenangkan Piala Mini Cup dengan memukul bola-bola kriket sebelum mereka mengenai wicket kamu.

Seni vs AI: Artis Cari Perlindungan dari Pencurian Gaya - picture from: readwrite - pibitek.biz - Manusia

Seni vs AI: Artis Cari Perlindungan dari Pencurian GayaSeni vs AI: Artis Cari Perlindungan dari Pencurian Gaya

Jahat • Saat ini, banyak artis khawatir ketika memposting karya seni online. Generator gambar AI terus meningkatkan kemampuan mereka dalam meniru gaya unik dengan biaya murah. Hampir semua platform populer berlomba-lomba untuk memperbarui ketentuan penggunaan untuk mengumpulkan data sebanyak mungkin untuk pelatihan AI. Alat seperti Glaze, yang menambahkan sedikit noise pada gambar untuk

Diskon Fire TV Stick Amazon menawarkan permainan Xbox melalui cloud - photo source: windowscentral - pibitek.biz - Bluetooth

Diskon Fire TV Stick Amazon menawarkan permainan Xbox melalui cloudDiskon Fire TV Stick Amazon menawarkan permainan Xbox melalui cloud

Amazon Fire TV Stick 4K dapat streaming game Xbox via cloud dengan harga diskon spesial. Fire TV Stick 4K Amazon mendukung Xbox Cloud Gaming dengan Wi-Fi 6 dan memiliki kapasitas penyimpanan lebih besar. Fire TV Stick 4K Amazon adalah pilihan yang baik... [Gov.19/07]

Useful Lists

by Dates :	2 Jul 20242 Jul 2024 10 Aug 202410 Aug 2024 1 Sep 20241 Sep 2024 18 Sep 202418 Sep 2024
by Authors :	Govan SeptiantaGovan Septianta Ineke AndamariIneke Andamari Wiwid KurniawatiWiwid Kurniawati
by Tags :	#ads#ads #amazon#amazon #microsoft#microsoft #rilis#rilis #tim#tim

Teknologi Prompt Caching Anthropic Hemat Biaya Pengembang

Related Post

Useful Lists