Mistral AI, Saingan OpenAI, Gandeng Microsoft Rilis 3 LLM baru



TL;DR
  • Mistral AI rilis tiga LLM baru, saingan ChatGPT.
  • Mistral gandeng Microsoft, jual LLM lewat Azure.
  • Mistral dapet dana besar, punya infrastruktur superkomputer.
Mistral AI, Saingan OpenAI, Gandeng Microsoft Rilis 3 LLM baru - credit to: siliconangle - pibitek.biz - Data

credit to: siliconangle


336-280

pibitek.biz - Mistral AI, startup AI yang punya dana besar, hari ini merilis tiga LLM dan layanan chatbot. Tujuannya, bersaing dengan ChatGPT milik OpenAI. Mistral juga umumkan kerja sama baru dengan Microsoft, investor utama OpenAI. Kerja sama ini bakal kasih akses infrastruktur superkomputer di Azure buat insinyur Mistral. Selain itu, Microsoft juga bakal jual model-model Mistral ke pelanggan cloud-nya. Mistral berbasis di Paris dan didirikan bulan Mei lalu.

Empat minggu kemudian, mereka dapet dana sebesar 113 juta dolar AS. Bulan Desember, mereka tambah lagi dana 415 juta dolar AS dari konsorsium yang dipimpin oleh Andreessen Horowitz dan Lightspeed Venture Partners. Sebelum hari ini, produk Mistral cuma dua model bahasa open-source dengan 7 miliar dan 46,7 miliar parameter.

Mistral tambah koleksi LLM-nya dengan tiga model eksklusif yang paling unggul adalah Mistral Large. Model ini bisa bikin teks dalam bahasa Inggris, Prancis, Spanyol, Jerman dan Italia. Selain itu, model ini juga bisa nulis kode dan selesain soal matematika.

Prompt yang dimasukin pengguna bisa sampai 32.000 token, satuan data yang isinya beberapa huruf atau angka. Mistral klaim model ini adalah yang kedua tercanggih di pasaran setelah GPT-4. Dalam tes yang melibatkan empat tolak ukur penalaran LLM, Mistral Large kalah tipis dari model andalan OpenAI.

Dalam tes lain, model ini jauh lebih baik dari Llama 2 70B, alternatif open-source GPT-4 yang dirilis oleh Meta Platforms tahun lalu. Pengembang bisa akses Mistral Large lewat API. API ini kasih kemampuan buat bikin aturan moderasi khusus buat model ini, dan juga nyambungin ke aplikasi lain.

Tim software bisa, misalnya, pakai Mistral Large buat jawab pertanyaan pengguna pake data dari database luar. API ini juga bisa bungkus output model ini dalam file JSON. JSON adalah format data yang memudahkan pindah data antar aplikasi.

Jadi, ini bisa kurangin kerjaan buat nampilin output sistem AI ke aplikasi kustom perusahaan. Mistral Large dirilis bareng model LLM baru lainnya yang namanya Mistral Small. Model ini kurang canggih dalam penalaran, tapi lebih murah dan cepat.

Meski begitu, model ini tetap janji bisa lebih bagus dari model LLM sebelumnya milik Mistral dalam beberapa jenis tugas penalaran. Mistral bakal kasih pelanggan akses ke model AI terbarunya dengan beberapa cara. Selain lewat API, Mistral juga mau jual LLM-nya lewat layanan mirip ChatGPT yang namanya Le Chat.

Layanan ini juga kasih akses ke model prototipe ketiga yang namanya Mistral Next yang katanya "dibuat buat singkat dan padat". Bersamaan dengan itu, Mistral juga jual LLM andalannya lewat Azure sebagai bagian dari kerja sama baru dengan Microsoft. Saat dirilis, platform cloud ini kasih akses ke Mistral Large.

Model-model eksklusif dan open-source Mistral yang lain bakal menyusul nanti. Kerja sama ini, yang disebut sebagai aliansi berjangka panjang, juga punya komponen lain. Mistral dapet akses ke infrastruktur superkomputer di Azure yang bakal dipake buat latih model baru dan jalankan beban inferensi.