OpenAI Rilis Dataset Multibahasa untuk Perluasan Akses AI Global

https://www.facebook.com/pibitek

September 25, 2024 Marza

credit: venturebeat

TL;DR

OpenAI rilis dataset MMMLU untuk perluasan AI bahasa global.
Dataset MMMLU membantu perusahaan menguji model AI dalam 14 bahasa.
OpenAI membuat MMMLU untuk membantu perusahaan dan peneliti AI global.

pibitek.biz -OpenAI telah membuat langkah besar dalam memperluas jangkauan global AI dengan merilis dataset multibahasa yang mengevaluasi kinerja model bahasa di 14 bahasa, termasuk Arab, Jerman, Swahili, Bengali, dan Yoruba. Dataset ini disebut Multilingual Massive Multitask Language Understanding (MMMLU) dan dirilis di platform data terbuka Hugging Face. MMMLU ini membangun dari platform populer Massive Multitask Language Understanding (MMLU) yang sebelumnya hanya dapat mengevaluasi pengetahuan AI dalam bahasa Inggris.

Dengan menambahkan berbagai bahasa, OpenAI membuat standar baru untuk kemampuan AI multibahasa. Hal ini juga dapat membuka akses lebih luas ke teknologi AI untuk seluruh masyarakat global. Industri AI telah menghadapi kritik atas ketidakmampuan mengembangkan model bahasa yang dapat memahami bahasa yang digunakan jutaan orang di seluruh dunia. Dengan merilis MMMLU, OpenAI menunjukkan komitmen untuk membuat teknologi AI lebih inklusif dan(global). MMMLU menantang model AI untuk beroperasi di berbagai lingkungan bahasa yang berbeda, mencerminkan kebutuhan akan sistem AI yang dapat berinteraksi dengan pengguna di seluruh dunia.

Seiring bisnis dan pemerintah semakin mengadopsi solusi AI, permintaan untuk model yang dapat memahami dan menghasilkan teks dalam berbagai bahasa menjadi semakin meningkat. Sampai baru-baru ini, penelitian AI fokus pada bahasa Inggris dan beberapa bahasa yang paling umum digunakan. Banyak bahasa yang memiliki sumber daya terbatas untuk pelatihan AI telah terpinggirkan. Dengan memasukkan bahasa seperti Swahili dan Yoruba, OpenAI menunjukkan komitmen untuk membuat teknologi AI lebih inklusif. Untuk membuat dataset MMMLU, OpenAI menggunakan penerjemah profesional untuk memastikan akurasi yang lebih tinggi daripada dataset yang menggunakan terjemahan mesin.

Terjemahan mesin dapat menyebabkan kesalahan, terutama pada bahasa yang memiliki sumber daya terbatas. Dengan menggunakan penerjemah profesional, OpenAI memastikan bahwa dataset MMMLU menjadi dasar yang lebih andal untuk mengevaluasi model AI dalam berbagai bahasa. Keputusan ini sangat penting bagi industri yang memerlukan ketepatan yang sangat tinggi, seperti perawatan kesehatan, hukum, dan keuangan. Kesalahan terjemahan yang kecil dapat memiliki implikasi yang serius. Dengan fokus pada kualitas terjemahan, OpenAI membuat dataset MMMLU menjadi alat yang sangat penting bagi perusahaan yang memerlukan sistem AI yang dapat beroperasi secara andal di berbagai bahasa.

Dengan merilis dataset MMMLU di Hugging Face, OpenAI berpartisipasi dalam pengembangan komunitas penelitian AI yang lebih luas. Hugging Face telah menjadi destinasi utama untuk alat dan dataset AI terbuka. Penambahan dataset MMMLU menunjukkan komitmen OpenAI untuk memajukan akses terbuka dalam penelitian AI. Namun, peluncuran MMMLU ini berlangsung saat OpenAI menghadapi kritik yang semakin meningkat atas pendekatan ke arah kebukaan. Kritik ini datang dari pendiri OpenAI sendiri, Elon Musk, yang telah menuduh perusahaan ini telah mengabaikan misinya sebagai organisasi non-profit dan terbuka.

Musk mengklaim bahwa OpenAI telah bergeser ke arah profit dan telah bermitra dengan Microsoft. OpenAI telah membela strategi mereka sekarang, yang mereka sebut sebagai "akses terbuka" daripada "sumber terbuka". Dalam kerangka ini, OpenAI bertujuan untuk memberikan akses yang luas ke teknologinya tanpa harus membagikan detail internal model-model yang paling canggih. Peluncuran dataset MMMLU sesuai dengan filosofi ini, memberikan komunitas penelitian alat yang kuat sambil tetap mempertahankan kontrol atas model-model propietas mereka.

Selain merilis dataset MMMLU, OpenAI juga merilis OpenAI Academy, yang diperuntukkan bagi pengembang dan organisasi yang memiliki misi penting dan ingin menggunakan AI untuk menyelesaikan masalah di komunitas mereka. Akademi ini akan menyediakan pelatihan, bimbingan teknis, dan kredit API senilai $1 juta untuk memungkinkan bakat AI setempat mengakses sumber daya mutakhir. Inisiatif ini melengkapi dataset MMMLU dengan menekankan komitmen OpenAI untuk membuat teknologi AI yang maju dan berkualitas tersedia bagi masyarakat global yang beragam.

Kedua-duanya, dataset MMMLU dan Akademi ini, mencerminkan strategi OpenAI jangka panjang untuk memastikan bahwa pengembangan AI membawa manfaat bagi seluruh umat manusia, terutama bagi masyarakat yang telah terpinggirkan oleh kemajuan AI terbaru. Untuk perusahaan, dataset MMMLU menawarkan kesempatan untuk mengevaluasi sistem AI mereka dalam konteks global. Saat perusahaan memperluas operasinya ke pasar internasional, kemampuan untuk menerapkan solusi AI yang memahami berbagai bahasa menjadi krusial.

Terlepas dari layanan pelanggan, moderasi konten, atau analisis data, model AI yang berkinerja baik dalam berbagai bahasa dapat menawarkan keunggulan kompetitif dengan mengurangi friksi komunikasi dan meningkatkan pengalaman pengguna. Fokus dataset pada subjek profesional dan akademik juga menambah nilai bagi perusahaan. Perusahaan dalam hukum, pendidikan, dan penelitian dapat menggunakan dataset MMMLU untuk menguji seberapa baik model AI mereka beroperasi dalam bidang spesifik, memastikan bahwa sistem mereka memenuhi standar yang sangat tinggi untuk bidang-bidang tersebut.

Peluncuran dataset MMMLU kemungkinan akan memiliki implikasi yang signifikan bagi industri AI. Saat perusahaan dan peneliti semakin menguji model mereka melawan standar multibahasa ini, permintaan sistem AI yang dapat beroperasi secara mulus dalam berbagai bahasa akan semakin meningkat. Hal ini dapat menimbulkan inovasi baru dalam pengolahan bahasa dan meningkatkan adopsi solusi AI di wilayah yang sebelumnya kurang terlayani oleh teknologi. Bagi OpenAI, peluncuran dataset MMMLU ini merupakan tantangan dan kesempatan.

Di satu sisi, perusahaan ini memposisikan diri sebagai pemimpin dalam AI multibahasa, menawarkan alat yang menutup celah penting dalam lanskap AI saat ini. Namun, pendirian OpenAI terhadap kebukaan akan terus dipertanyakan saat perusahaan ini mencermati ketegangan antara kepentingan publik dan kepentingan swasta. Saat AI semakin terintegrasi ke dalam ekonomi global, perusahaan dan pemerintah harus berhadapan dengan implikasi etis dan praktis dari teknologi ini. Peluncuran dataset MMMLU oleh OpenAI merupakan langkah yang tepat, tetapi juga menimbulkan pertanyaan tentang seberapa banyak revolusi AI akan dapat diakses oleh semua.

Dan OpenAI rupanya memiliki pendekatan yang longgar dalam mengembangkan teknologi mereka, sehingga teknologi ini dengan mudah dapat disalahgunakan oleh pihak yang tidak bertanggung jawab. Jika di masa depan perusahaan ini terus berkembang dalam semangat 'apa saja boleh' yang sekarang ini sedang mereka jalankan, wajar jika banyak orang khawatir soal hal ini. Banyak sekali celah yang bisa disalahgunakan yang saat ini masih belum dipikirkan dan karena itu pendekatan yang demikian sewajarnya lebih hati-hati dalam menciptakan terobosan baru dalam pengembangan AI di berbagai bidang, tidak terkecuali pengembangan model AI berbasis sistem operasi robot AI.

Game Pass Juli 2024: Daftar KeinginanGame Pass Juli 2024: Daftar Keinginan

Platform — Game Pass Juli 2024 akan menambahkan game baru, termasuk Dungeons of Hinterberg dan Flintlock: The Siege of Dawn. Penggemar berharap game seperti Baldur's Gate 3, Armored...

Microsoft Gelar KTT Keamanan Usai Gagal CrowdStrike - credit for: arstechnica - pibitek.biz - USD

Microsoft Gelar KTT Keamanan Usai Gagal CrowdStrike – RumahMicrosoft Gelar KTT Keamanan Usai Gagal CrowdStrike – Rumah

Microsoft akan gelar KTT keamanan setelah pembaruan software CrowdStrike gagal, membuat sistem operasi Windows mengalami gangguan. Microsoft pertimbangkan untuk memblokir...

ManageEngine Rilis Platform Kecerdasan Keputusan untuk Operasional TI - credit for: intelligentcio - pibitek.biz - Efisiensi

ManageEngine Rilis Platform Kecerdasan Keputusan untuk Operasional TI – IntegrasiManageEngine Rilis Platform Kecerdasan Keputusan untuk Operasional TI – Integrasi

ManageEngine, perusahaan terkemuka dalam penyediaan solusi TI terpadu, telah mengumumkan peluncuran platform kecerdasan keputusan terbaru untuk meningkatkan operasi TI. Platform ini merupakan pengembangan signifikan dari solusi analitik TI unggulan perusahaan, Analytics Plus, yang dikenal sebagai solusi yang komprehensif untuk mengoptimalkan kinerja TI. Versi 6.0 dari Analytics Plus menghadirkan Spotlight, sebuah

Controller Langka Nintendo PlayStation Laku $35.000 - picture source: gamerant - pibitek.biz - Manusia

Controller Langka Nintendo PlayStation Laku $35.000Controller Langka Nintendo PlayStation Laku $35.000

Sony — Controller PlayStation langka terjual $35.000, milik konsol Nintendo PlayStation yang tak pernah dirilis. Nintendo dan Sony bekerja sama menciptakan konsol...

Sertifikat TLS DigiCert Di-revoke Massal - image from: bleepingcomputer - pibitek.biz - Aplikasi

Sertifikat TLS DigiCert Di-revoke Massal! [Sistem]Sertifikat TLS DigiCert Di-revoke Massal! [Sistem]

DigiCert ngelakuin pembatalan sertifikat TLS massal gara-gara bug pada verifikasi domain. Bug DigiCert bikin sistem salah dalam verifikasi kepemilikan domain...

AI: Super Cerdas, Obat Ajaib, dan Kripto Manusia - credit: pymnts - pibitek.biz - milyar

AI: Super Cerdas, Obat Ajaib, dan Kripto ManusiaAI: Super Cerdas, Obat Ajaib, dan Kripto Manusia

Sepekan ini, AI jadi topik panas. Si jagoan teknologi lagi sibuk ngejar ambisi besar, bikin obat, dan ngebangun dunia digital. Pertama, Ilya Sutskever, si pentolan OpenAI, balik lagi ke dunia AI dengan proyek barunya, Safe Superintelligence (SSI). Proyek ini ngincar superintelligensia yang aman dan berbekal dana 1 miliar dolar. Modal [pibitek.biz|1709]

Intel Rilis Prosesor Arrow Lake - image origin: xda-developers - pibitek.biz - i9

Intel Rilis Prosesor Arrow Lake — NPUIntel Rilis Prosesor Arrow Lake — NPU

Intel merilis prosesor Arrow Lake untuk bersaing dengan AMD. Prosesor ini menawarkan efisiensi daya dan performa yang lebih baik. Meskipun demikian, prosesor...

COSMIC Linux: Sebuah Revolusi di Dunia Desktop - image origin: zdnet - pibitek.biz - Efisiensi

COSMIC Linux: Sebuah Revolusi di Dunia DesktopCOSMIC Linux: Sebuah Revolusi di Dunia Desktop

Rilis — COSMIC, desktop lingkungan terbaru dari System76, berambisi merevolusi pengalaman desktop Linux dengan fokus pada performa, efisiensi, dan antarmuka intuitif....

Useful Lists

by Dates :	8 Jul 20248 Jul 2024 27 Aug 202427 Aug 2024 31 Aug 202431 Aug 2024 10 Oct 202410 Oct 2024 16 Oct 202416 Oct 2024
by Authors :	Dicky DerilandryDicky Derilandry Aris Banu PradaniAris Banu Pradani Heni Qania SulastriHeni Qania Sulastri Wiwid KurniawatiWiwid Kurniawati
by Tags :	#alpha#alpha #bahasa#bahasa #bisnis#bisnis #flagship#flagship #game#game

OpenAI Rilis Dataset Multibahasa untuk Perluasan Akses AI Global

Related Post

Useful Lists