Model AI Alibaba Jago Matematika



Model AI Alibaba Jago Matematika - photo owner: aibusiness - pibitek.biz - Rilis

photo owner: aibusiness


336-280
TL;DR
  • Alibaba rilis model matematika khusus bernama Qwen2-Math, dengan kemampuan unggul dalam menyelesaikan soal matematika kompleks.
  • Qwen2-Math merupakan versi khusus dari model bahasa Qwen2 yang dapat menangani masalah matematika mulai dari aritmatika dasar hingga kompleks, dengan model-model ini dapat mengalahkan model-model terkemuka.
  • Model Qwen2-Math Alibaba unggul dalam tes tolak ukur khusus matematika dan bahkan mengalahkan model-model dasar canggih lainnya dalam menguji kemampuan matematika, meningkatkan kemampuan kognitif secara keseluruhan.

pibitek.biz -Alibaba, perusahaan teknologi raksasa asal Tiongkok, baru-baru ini merilis model bahasa khusus yang dirancang untuk memecahkan masalah matematika yang kompleks. Model bernama Qwen2-Math ini mendemonstrasikan kemampuan luar biasa dalam menyelesaikan soal-soal matematika, bahkan mengalahkan model andalan dari perusahaan AI ternama seperti OpenAI dan Anthropic. Qwen2-Math adalah versi khusus dari model bahasa Qwen2 yang baru-baru ini dirilis oleh Alibaba. Model ini dirancang khusus untuk menangani masalah matematika, mulai dari aritmatika dasar hingga soal-soal yang lebih kompleks.

Qwen2-Math tersedia dalam tiga ukuran, mulai dari yang paling kecil dengan 1,5 miliar parameter hingga model standar dengan 72 miliar parameter. Ketiga model ini menunjukkan kinerja yang luar biasa dalam evaluasi yang berfokus pada matematika, dengan model terbesar yang mampu mengalahkan model-model proprietary seperti GPT-4o dan Claude 3.5 dalam tugas-tugas terkait matematika. Tim peneliti AI Alibaba menyatakan bahwa mereka telah menghabiskan waktu lebih dari setahun untuk "meneliti dan meningkatkan kemampuan penalaran LLM" untuk meningkatkan kemampuan mereka dalam menangani masalah matematika.

Peneliti AI semakin fokus pada matematika sebagai bidang studi utama untuk meningkatkan kemampuan penalaran model. Mereka percaya bahwa dengan meningkatkan kemampuan model dalam menalar pertanyaan secara metodis, model AI dapat secara signifikan meningkatkan kemampuan kognitifnya secara keseluruhan. Model-model seperti Mathstral, yang dikembangkan oleh Mistral, juga dirancang untuk menyelesaikan masalah matematika dengan menggunakan penalaran logis multi-langkah. Model-model dasar seperti GPT-4o dari OpenAI dan Llama 3.1 405B dari Meta juga menunjukkan peningkatan kemampuan matematika.

Namun, model khusus dari Alibaba ini unggul dalam mengalahkan model-model canggih, termasuk model-model dasar, dalam tes tolak ukur khusus matematika. Tes ini meliputi Math, MMLU Stem, dan CMath, serta tolak ukur matematika Tiongkok seperti GaoKao Math QA. Alibaba bahkan menciptakan versi Instruct dari model matematika baru ini, yang mencapai tingkat kinerja terbaik dibandingkan dengan model-model terkemuka di industri. Saat ini, serangkaian model Qwen2-Math hanya mendukung bahasa Inggris. Namun, Alibaba menyatakan bahwa mereka akan mengembangkan versi bilingual untuk memperluas dukungan ke bahasa Tiongkok.