StreamingLLM, MIT Bikin Chatbot Makin Jago Ngobrol

https://www.facebook.com/pibitek

March 20, 2024 Amalia

TL;DR

StreamingLLM, solusi MIT buat chatbot ngobrol lama.
Pakai Sliding Cache, simpan data kunci dan attention sink.
Model jadi stabil, cepat, dan dinamis.

picture owner: aibusiness

pibitek.biz - Chatbot biasanya makin lama ngobrol, makin jelek jawabannya. Tapi, tim peneliti dari MIT punya solusi biar chatbot kayak ChatGPT atau Gemini bisa ngobrol terus tanpa kualitasnya turun. Solusinya namanya StreamingLLM, sebuah kerangka kerja yang mengubah cara model chatbot menyimpan memori percakapan. Model chatbot pakai sesuatu yang namanya Key-value (KV) Cache buat nyimpen data percakapan. KV Cache ini bikin peta perhatian yang nunjukin hubungan antara kata-kata yang dipakai. Tapi, KV Cache ini punya batas kapasitas, jadi kalo udah penuh, dia bakal buang data lama.

Peneliti MIT punya ide buat bikin Sliding Cache, yaitu KV Cache yang bisa buang data yang kurang penting tapi tetep nyimpen data kunci. Dengan begitu, chatbot bisa ngobrol sama pengguna tanpa kualitasnya anjlok. Dalam makalah StreamingLLM, peneliti bilang bahwa solusi ini bikin model kayak Llama 2 dan Falcon bisa stabil walaupun percakapannya udah lewat empat juta kata.

Bahkan, metode ini bikin model bisa jawab lebih dari 22 kali lebih cepat. "Dengan bikin chatbot yang bisa ngobrol terus sama kita, dan yang bisa jawab sesuai dengan percakapan kita sebelumnya, kita bisa pakai chatbot ini buat aplikasi baru", kata Guangxuan Xiao, penulis utama makalah StreamingLLM, ke MIT News. Peneliti juga nemuin bahwa input pertama dari sebuah pertanyaan itu paling penting.

Kalo input ini ilang pas KV Cache penuh, itu bikin model gagal ngobrol lama. Tapi, kalo input ini tetep ada, kualitasnya tetep bagus. Mereka sebut fenomena ini "attention sink".

Cukup dengan empat input awal, chatbot yang pakai Sliding Cache bisa ngobrol terus tanpa kualitasnya turun. Malah, kualitasnya jadi optimal. Peneliti juga nemuin bahwa nambahin token tempat buat attention sink pas pra-latih bisa bikin kinerja model makin baik.

Song Han, anggota MIT-IBM Watson AI Lab dan ilmuwan terkemuka Nvidia, bilang ke MIT News: "Kita butuh attention sink, dan model memutuskan buat pakai token pertama sebagai attention sink karena dia bisa keliatan sama semua token lain". "Kita nemuin bahwa kita harus tetep nyimpen attention sink di KV Cache biar modelnya tetep dinamis". Kamu bisa coba StreamingLLM lewat perpustakaan optimasi LLM Nvidia, TensorRT-LLM.

Glaze dan Nightshade: Lindungi Karya Seni dari Pencurian oleh AI Art — PCGlaze dan Nightshade: Lindungi Karya Seni dari Pencurian oleh AI Art — PC

Glaze dan Nightshade, aplikasi untuk melindungi seni dari AI. Glaze tambah noise, Nightshade rusak model AI. Cara download, install, dan pakai aplikasi ini.

Setelah setahun, Amazon Menghentikan Opsi Pembayaran Venmo - image source: popsci - pibitek.biz - PayPal

AWS – Setelah setahun, Amazon Menghentikan Opsi Pembayaran VenmoAWS – Setelah setahun, Amazon Menghentikan Opsi Pembayaran Venmo

Amazon membatalkan kemitraan pembayarannya dengan Venmo, hanya setahun setelah pertama kali menawarkan opsi tersebut kepada pengguna. Venmo juga mengumumkan perubahan kebijakan yang tiba-tiba melalui pembaruan singkat pada halaman tutorial "Menggunakan Venmo di Amazon", dengan alasan hanya "perubahan terbaru". Tangkapan layar yang diposting di platform media sosial X (dulu Twitter), menunjukkan

TSMC Umumkan Keterlambatan Pabrik Arizona Hingga 2027 - credit: jackyrosalind - pibitek.biz - Apple

TSMC Umumkan Keterlambatan Pabrik Arizona Hingga 2027 – TSMCTSMC Umumkan Keterlambatan Pabrik Arizona Hingga 2027 – TSMC

TSMC mengumumkan penundaan pabrik barunya di Arizona hingga 2027. Penundaan ini dapat mempengaruhi perluasan operasi dan jenis wafer yang diproduksi. Dana

7 Cara Maksimalkan Pencahayaan untuk Foto Produk Ecommerce - credit to: podean - pibitek.biz - AMOLED

Matahari • 7 Cara Maksimalkan Pencahayaan untuk Foto Produk EcommerceMatahari • 7 Cara Maksimalkan Pencahayaan untuk Foto Produk Ecommerce

Pencahayaan yang bagus meningkatkan penampilan dan penjualan produk di Amazon dan platform ecommerce lainnya. Menggunakan kotak cahaya DIY dapat menghasilkan pencahayaan yang merata dan detail. Reflektor membantu mengurangi bayangan dan memberikan

Harga dan Spesifikasi Handheld Gaming MSI Claw Terbaru - credit: windowscentral - pibitek.biz - Windows

Harga dan Spesifikasi Handheld Gaming MSI Claw Terbaru — WindowsHarga dan Spesifikasi Handheld Gaming MSI Claw Terbaru — Windows

MSI Claw adalah handheld gaming pertama dengan prosesor Intel Core Ultra dan grafis Intel Arc. Harga MSI Claw dimulai dari USD 699.99 (11 jutaan rupiah) dengan

Komet Setan Hijau dengan Ledakan Fotogenik Dekati Bumi - the photo via: livescience - pibitek.biz - Matahari

Matahari – Komet Setan Hijau dengan Ledakan Fotogenik Dekati BumiMatahari – Komet Setan Hijau dengan Ledakan Fotogenik Dekati Bumi

Komet 'Setan Hijau', yang dikenal sebagai Komet 12P/Pons-Brooks, baru-baru ini mencuri perhatian astronomi saat melintas di depan nebula merah yang memukau. Komet berwarna hijau ini, yang sudah lama ditunggu untuk meletus lagi, akan mendekati Bumi pada tahun ini. Komet ini, dengan diameter sekitar 10,5 mil (17 kilometer), merupakan komet kriovulkanik,

Penawaran Spesial Tesla China untuk Pemilik Mobil - credit: carnewschina - pibitek.biz - Ads

Penawaran Spesial Tesla China untuk Pemilik MobilPenawaran Spesial Tesla China untuk Pemilik Mobil

Rilis • Tesla China kasih promo spesial buat pemilik mobil. Promo termasuk transfer FSD/EAP, supercharging gratis, dan paket cuaca dingin. Promo berlaku sampai 31 Maret 2024 dengan syarat tertentu.

Studi MIT Temukan Dampak Terbatas AI pada Pekerjaan Visual - credit: techspot - pibitek.biz - Machine Learning

Studi MIT Temukan Dampak Terbatas AI pada Pekerjaan Visual – AI GeneratifStudi MIT Temukan Dampak Terbatas AI pada Pekerjaan Visual – AI Generatif

Sebuah studi yang dilakukan oleh MIT menemukan bahwa dampak AI terhadapdampak AI terhadap pekerjaan yang membutuhkan tugas visual tidaklah sebesar yang dikhawatirkan. Bekerja sama dengan IBM Institute for Business Value, para peneliti dari MIT's Computer Science and Artificial Intelligence Laboratory (CSAIL) melakukan peninjauan ulang terhadap potensi dampak algoritma machine learning

Useful Lists

by Dates :	12 Dec 202312 Dec 2023 28 Jan 202428 Jan 2024 8 Feb 20248 Feb 2024 9 Feb 20249 Feb 2024 11 Feb 202411 Feb 2024
by Authors :	Anisa AyuandiraAnisa Ayuandira Aulia SuryaningAulia Suryaning Yesi Tioni HandayaniYesi Tioni Handayani
by Tags :	#akurasi#akurasi #android#android #chatbot#chatbot #sosmed#sosmed

StreamingLLM, MIT Bikin Chatbot Makin Jago Ngobrol

Related Post

Useful Lists