- OpenAI rilis dataset MMMLU untuk perluasan AI bahasa global.
- Dataset MMMLU membantu perusahaan menguji model AI dalam 14 bahasa.
- OpenAI membuat MMMLU untuk membantu perusahaan dan peneliti AI global.
pibitek.biz -OpenAI telah membuat langkah besar dalam memperluas jangkauan global AI dengan merilis dataset multibahasa yang mengevaluasi kinerja model bahasa di 14 bahasa, termasuk Arab, Jerman, Swahili, Bengali, dan Yoruba. Dataset ini disebut Multilingual Massive Multitask Language Understanding (MMMLU) dan dirilis di platform data terbuka Hugging Face. MMMLU ini membangun dari platform populer Massive Multitask Language Understanding (MMLU) yang sebelumnya hanya dapat mengevaluasi pengetahuan AI dalam bahasa Inggris.
2 – Startup AI Perplexity Bidik Pendanaan 7 Triliun 2 – Startup AI Perplexity Bidik Pendanaan 7 Triliun
3 – Ancaman Cerberus, Trojan Perbankan yang Sulit Dideteksi 3 – Ancaman Cerberus, Trojan Perbankan yang Sulit Dideteksi
Dengan menambahkan berbagai bahasa, OpenAI membuat standar baru untuk kemampuan AI multibahasa. Hal ini juga dapat membuka akses lebih luas ke teknologi AI untuk seluruh masyarakat global. Industri AI telah menghadapi kritik atas ketidakmampuan mengembangkan model bahasa yang dapat memahami bahasa yang digunakan jutaan orang di seluruh dunia. Dengan merilis MMMLU, OpenAI menunjukkan komitmen untuk membuat teknologi AI lebih inklusif dan(global). MMMLU menantang model AI untuk beroperasi di berbagai lingkungan bahasa yang berbeda, mencerminkan kebutuhan akan sistem AI yang dapat berinteraksi dengan pengguna di seluruh dunia.
Seiring bisnis dan pemerintah semakin mengadopsi solusi AI, permintaan untuk model yang dapat memahami dan menghasilkan teks dalam berbagai bahasa menjadi semakin meningkat. Sampai baru-baru ini, penelitian AI fokus pada bahasa Inggris dan beberapa bahasa yang paling umum digunakan. Banyak bahasa yang memiliki sumber daya terbatas untuk pelatihan AI telah terpinggirkan. Dengan memasukkan bahasa seperti Swahili dan Yoruba, OpenAI menunjukkan komitmen untuk membuat teknologi AI lebih inklusif. Untuk membuat dataset MMMLU, OpenAI menggunakan penerjemah profesional untuk memastikan akurasi yang lebih tinggi daripada dataset yang menggunakan terjemahan mesin.
Terjemahan mesin dapat menyebabkan kesalahan, terutama pada bahasa yang memiliki sumber daya terbatas. Dengan menggunakan penerjemah profesional, OpenAI memastikan bahwa dataset MMMLU menjadi dasar yang lebih andal untuk mengevaluasi model AI dalam berbagai bahasa. Keputusan ini sangat penting bagi industri yang memerlukan ketepatan yang sangat tinggi, seperti perawatan kesehatan, hukum, dan keuangan. Kesalahan terjemahan yang kecil dapat memiliki implikasi yang serius. Dengan fokus pada kualitas terjemahan, OpenAI membuat dataset MMMLU menjadi alat yang sangat penting bagi perusahaan yang memerlukan sistem AI yang dapat beroperasi secara andal di berbagai bahasa.
Dengan merilis dataset MMMLU di Hugging Face, OpenAI berpartisipasi dalam pengembangan komunitas penelitian AI yang lebih luas. Hugging Face telah menjadi destinasi utama untuk alat dan dataset AI terbuka. Penambahan dataset MMMLU menunjukkan komitmen OpenAI untuk memajukan akses terbuka dalam penelitian AI. Namun, peluncuran MMMLU ini berlangsung saat OpenAI menghadapi kritik yang semakin meningkat atas pendekatan ke arah kebukaan. Kritik ini datang dari pendiri OpenAI sendiri, Elon Musk, yang telah menuduh perusahaan ini telah mengabaikan misinya sebagai organisasi non-profit dan terbuka.
Musk mengklaim bahwa OpenAI telah bergeser ke arah profit dan telah bermitra dengan Microsoft. OpenAI telah membela strategi mereka sekarang, yang mereka sebut sebagai "akses terbuka" daripada "sumber terbuka". Dalam kerangka ini, OpenAI bertujuan untuk memberikan akses yang luas ke teknologinya tanpa harus membagikan detail internal model-model yang paling canggih. Peluncuran dataset MMMLU sesuai dengan filosofi ini, memberikan komunitas penelitian alat yang kuat sambil tetap mempertahankan kontrol atas model-model propietas mereka.
Selain merilis dataset MMMLU, OpenAI juga merilis OpenAI Academy, yang diperuntukkan bagi pengembang dan organisasi yang memiliki misi penting dan ingin menggunakan AI untuk menyelesaikan masalah di komunitas mereka. Akademi ini akan menyediakan pelatihan, bimbingan teknis, dan kredit API senilai $1 juta untuk memungkinkan bakat AI setempat mengakses sumber daya mutakhir. Inisiatif ini melengkapi dataset MMMLU dengan menekankan komitmen OpenAI untuk membuat teknologi AI yang maju dan berkualitas tersedia bagi masyarakat global yang beragam.
Kedua-duanya, dataset MMMLU dan Akademi ini, mencerminkan strategi OpenAI jangka panjang untuk memastikan bahwa pengembangan AI membawa manfaat bagi seluruh umat manusia, terutama bagi masyarakat yang telah terpinggirkan oleh kemajuan AI terbaru. Untuk perusahaan, dataset MMMLU menawarkan kesempatan untuk mengevaluasi sistem AI mereka dalam konteks global. Saat perusahaan memperluas operasinya ke pasar internasional, kemampuan untuk menerapkan solusi AI yang memahami berbagai bahasa menjadi krusial.
Terlepas dari layanan pelanggan, moderasi konten, atau analisis data, model AI yang berkinerja baik dalam berbagai bahasa dapat menawarkan keunggulan kompetitif dengan mengurangi friksi komunikasi dan meningkatkan pengalaman pengguna. Fokus dataset pada subjek profesional dan akademik juga menambah nilai bagi perusahaan. Perusahaan dalam hukum, pendidikan, dan penelitian dapat menggunakan dataset MMMLU untuk menguji seberapa baik model AI mereka beroperasi dalam bidang spesifik, memastikan bahwa sistem mereka memenuhi standar yang sangat tinggi untuk bidang-bidang tersebut.
Peluncuran dataset MMMLU kemungkinan akan memiliki implikasi yang signifikan bagi industri AI. Saat perusahaan dan peneliti semakin menguji model mereka melawan standar multibahasa ini, permintaan sistem AI yang dapat beroperasi secara mulus dalam berbagai bahasa akan semakin meningkat. Hal ini dapat menimbulkan inovasi baru dalam pengolahan bahasa dan meningkatkan adopsi solusi AI di wilayah yang sebelumnya kurang terlayani oleh teknologi. Bagi OpenAI, peluncuran dataset MMMLU ini merupakan tantangan dan kesempatan.
Di satu sisi, perusahaan ini memposisikan diri sebagai pemimpin dalam AI multibahasa, menawarkan alat yang menutup celah penting dalam lanskap AI saat ini. Namun, pendirian OpenAI terhadap kebukaan akan terus dipertanyakan saat perusahaan ini mencermati ketegangan antara kepentingan publik dan kepentingan swasta. Saat AI semakin terintegrasi ke dalam ekonomi global, perusahaan dan pemerintah harus berhadapan dengan implikasi etis dan praktis dari teknologi ini. Peluncuran dataset MMMLU oleh OpenAI merupakan langkah yang tepat, tetapi juga menimbulkan pertanyaan tentang seberapa banyak revolusi AI akan dapat diakses oleh semua.
Dan OpenAI rupanya memiliki pendekatan yang longgar dalam mengembangkan teknologi mereka, sehingga teknologi ini dengan mudah dapat disalahgunakan oleh pihak yang tidak bertanggung jawab. Jika di masa depan perusahaan ini terus berkembang dalam semangat 'apa saja boleh' yang sekarang ini sedang mereka jalankan, wajar jika banyak orang khawatir soal hal ini. Banyak sekali celah yang bisa disalahgunakan yang saat ini masih belum dipikirkan dan karena itu pendekatan yang demikian sewajarnya lebih hati-hati dalam menciptakan terobosan baru dalam pengembangan AI di berbagai bidang, tidak terkecuali pengembangan model AI berbasis sistem operasi robot AI.