Mistral AI Rilis Tiga Model Bahasa Open-Weight

https://www.facebook.com/pibitek

August 17, 2024 Disya

photo owner: infoq

TL;DR

Mistral AI baru-baru ini merilis tiga model bahasa open-weight. Yaitu Mistral NeMo, Codestral Mamba, dan Mathstral.
Mistral NeMo, yang disebut sebagai "model kecil terbaik", dapat memproses 128.000 token.

pibitek.biz -Mistral AI baru-baru ini merilis tiga model bahasa open-weight: Mistral NeMo, sebuah model bahasa multiguna dengan 12 miliar parameter; Codestral Mamba, model generator kode dengan 7 miliar parameter; dan Mathstral, model dengan 7 miliar parameter yang dirancang khusus untuk menyelesaikan soal matematika dan penalaran. Ketiga model ini dirilis di bawah lisensi Apache 2. Mistral NeMo adalah model bahasa yang disebut sebagai "model kecil terbaik" oleh Mistral AI.

Model ini mampu memproses hingga 128.000 token dan tersedia dalam dua versi: model dasar dan model yang telah dilatih untuk menerima instruksi. Mistral NeMo mendukung berbagai bahasa dan mencatatkan performa yang baik di 11 bahasa, termasuk bahasa Mandarin, Jepang, Arab, dan Hindi. Mistral AI mengembangkan tokenizer baru bernama Tekken untuk model ini, yang mampu mengompres kode sumber dan bahasa alami dengan lebih efisien.

Mistral NeMo mampu mengalahkan model sejenis, seperti Gemma 2 9B dan Llama 3 8B, pada berbagai benchmark seperti MMLU dan Winogrande.Codestral Mamba dibangun di atas arsitektur Mamba, sebuah alternatif dari arsitektur Transformer yang umum digunakan pada model bahasa lainnya. Model Mamba menawarkan inferensi yang lebih cepat dibandingkan Transformer dan secara teoritis memiliki panjang konteks tak terbatas. Mistral AI menyatakan bahwa Codestral Mamba mampu memberikan respons cepat, terlepas dari panjang input, dan memiliki performa setara dengan model berbasis Transformer yang lebih besar, seperti CodeLlama 34B.

Mathstral dikembangkan bersama Project Numina, sebuah organisasi nirlaba yang bertujuan mengembangkan AI untuk bidang matematika. Model ini berdasarkan Mistral 7B dan telah disempurnakan untuk mencapai performa tinggi dalam bidang STEM. Mistral AI menyatakan bahwa Mathstral mampu mencapai kinerja terbaik di kelasnya pada beberapa benchmark, termasuk skor 63,47% pada MMLU dan 56,6% pada MATH.

Para pengguna di Hacker News juga membahas tentang Codestral Mamba, berspekulasi apakah model ini akan menjadi solusi yang baik untuk asisten pemrograman "offline" atau yang dihosting secara lokal. Salah satu pengguna menulis bahwa Codestral Mamba akan menjadi "alat yang sangat menarik untuk asisten pemrograman berbasis desktop". Model-model baru ini dapat diunduh melalui Huggingface atau melalui SDK Mistral mistral-inference. Mistral NeMO dan Codestral Mamba juga tersedia melalui API La Plateforme milik Mistral AI.

Cloudflare Hentikan AI Scraping, Pemilik Situs Senang • KreatorCloudflare Hentikan AI Scraping, Pemilik Situs Senang • Kreator

Cloudflare, layanan web hosting yang ngetop banget, ngasih kabar gembira buat para pemilik situs web. Gimana enggak? Cloudflare punya senjata baru buat menghentikan AI scraping yang udah kayak banjir bandang. Buat pemilik situs web yang udah nyerah ngelawan AI scraping, Cloudflare kasih solusi jitu, sekarang pemilik situs web bisa nge-blok

AI Meroket, IT Tradisonal Terpuruk - image origin: techspot - pibitek.biz - AI Generatif

AI — AI Meroket, IT Tradisonal TerpurukAI — AI Meroket, IT Tradisonal Terpuruk

Perusahaan teknologi besar menginvestasikan uang besar untuk cloud dan teknologi AI. Perusahaan cloud seperti Microsoft, Alphabet, dan Meta meningkatkan investasi AI sebesar 60% untuk teknologi informasi. Pengeluaran perusahaan untuk teknologi dan...

Hotjar dan Business Insider Kena Hack - photo source: infosecurity-magazine - pibitek.biz - Jahat

Hotjar dan Business Insider Kena Hack!Hotjar dan Business Insider Kena Hack!

Awas! Dua platform populer, Hotjar dan Business Insider, ketahuan punya celah keamanan serius. Tim peneliti dari Salt Labs menemukan kelemahan yang bisa bikin akun pengguna dibajak. Hotjar, yang sering dipakai bareng Google Analytics, ternyata menyimpan banyak data sensitif, kayak aktivitas pengguna di web, data pribadi, chat, bahkan kata sandi. Bayangin, {0912,Bob}

Anthropic Didakwa Mencuri Karya Penulis - photo source: fortune - pibitek.biz - LLM

LLM — Anthropic Didakwa Mencuri Karya PenulisLLM — Anthropic Didakwa Mencuri Karya Penulis

Anthropic digugat oleh penulis karena mencuri karya mereka. Perusahaan itu dituduh menggunakan buku bajakan untuk melatih AI. Gugatan ini mempertanyakan etika pengembangan AI dan hak cipta.

Samsung Galaxy S24 FE: AI yang Membosankan - credit: gizmodo - pibitek.biz - Sketch

Samsung Galaxy S24 FE: AI yang MembosankanSamsung Galaxy S24 FE: AI yang Membosankan

Teknologi – Samsung, raksasa teknologi asal Korea Selatan, secara konsisten menghadirkan lini "fan edition" atau FE sebagai cara untuk menyajikan fitur unggulan pada perangkat kelas atas mereka kepada konsumen yang tidak ingin mengeluarkan biaya mahal. Galaxy S24 FE, edisi terbaru dari lini FE ini, hadir dengan desain persegi yang tajam dan dipenuhi

Peringatan Firewall: Celah Keamanan Palo Alto Networks - credit for: bleepingcomputer - pibitek.biz - XSS

Peringatan Firewall: Celah Keamanan Palo Alto Networks – SiberPeringatan Firewall: Celah Keamanan Palo Alto Networks – Siber

Palo Alto Networks mengeluarkan peringatan mendesak terkait kerentanan keamanan yang dapat memungkinkan peretas menguasai firewall mereka. Kerentanan ini dapat memungkinkan penyerang mengakses data sensitif, termasuk kredensial pengguna, dan...

AI Bisa Nilai Karyawan: Solusi Atau Ancaman Bagi Manusia? - credit for: pymnts - pibitek.biz - milyar

AI Bisa Nilai Karyawan: Solusi Atau Ancaman Bagi Manusia?AI Bisa Nilai Karyawan: Solusi Atau Ancaman Bagi Manusia?

AI ngebuat perusahaan lebih mudah nge-nilai karyawan, sampe bisa tahu siapa yang perlu dibantu. AI ngebuat karyawan ngerasa dipantau terus, sampe ada yang... [3/03 Gra pibitek.biz]

Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos - image from: scottaaronson - pibitek.biz - Google

Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos!Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos!

Sebuah diskusi hangat tengah berlangsung di dunia komputasi kuantum mengenai kemampuan algoritma kuantum untuk memecahkan masalah optimasi NP-hard. Algoritma Quantum Approximate Optimization Algorithm (QAOA), yang menjadi pusat perhatian, diklaim memiliki potensi besar untuk merevolusi berbagai industri dengan kemampuannya menemukan solusi yang lebih baik untuk masalah-masalah tersebut. Namun, klaim ini seringkali {Manusia,Rat,pibitek.biz}

Useful Lists

by Dates :	27 Sep 202427 Sep 2024 9 Oct 20249 Oct 2024 12 Oct 202412 Oct 2024
by Authors :	Bob Firas SidhartaBob Firas Sidharta Govan SeptiantaGovan Septianta Ratih Aini KusumawardhaniRatih Aini Kusumawardhani Heni Qania SulastriHeni Qania Sulastri
by Tags :	#hacker#hacker #intel#intel #meta#meta #software#software

Mistral AI Rilis Tiga Model Bahasa Open-Weight

Related Post

Useful Lists