Google Pakai Postingan Reddit untuk Latih AI yang Aman



TL;DR
  • Google bayar Reddit untuk latih AI-nya.
  • Pengguna Reddit khawatir data mereka disalahgunakan.
  • Google perlu atur model AI-nya agar nggak berbahaya.
Google Pakai Postingan Reddit untuk Latih AI yang Aman - photo from: aibusiness - pibitek.biz - Sosmed

photo from: aibusiness


336-280

pibitek.biz - Reddit adalah platform diskusi komunitas yang penuh dengan berbagai macam postingan pengguna. Mulai dari meme lucu sampai teori konspirasi gila. Tapi postingan-postingan itu sebentar lagi bakal dimanfaatkan oleh Google untuk melatih model-model AI-nya.

Google sudah bikin kesepakatan dengan Reddit senilai 60 juta dollar AS per tahun untuk dapat akses ke konten pengguna Reddit. Postingan-postingan itu akan dipakai untuk pelatihan model-model AI Google. Google dan Reddit belum mau berkomentar soal kesepakatan ini.

Tapi CEO Reddit, Steve Huffman, pernah bilang ke The New York Times kalau data Reddit itu sangat berharga. Tapi dia nggak mau kasih gratis ke perusahaan-perusahaan besar di dunia. Di Reddit, pengguna masih punya hak atas konten mereka.

Tapi Reddit bisa ngasih lisensi ke pelanggan seperti Google. Sebagai reaksi, pengguna Reddit mulai posting omong kosong untuk bingungin sistem AI dengan informasi nggak berguna. Untuk Google, kesepakatan ini memberi sumber data tambahan untuk memperkuat model-model AI-nya yang makin banyak.

Minggu lalu, Google baru aja perkenalkan keluarga model open source kecil bernama Gemma. Untuk Reddit, kesepakatan ini memberi sumber pendapatan lain sebelum IPO yang ditunggu-tunggu. Reddit lagi susah cari duit dari iklan karena kalah saing sama media sosial baru seperti TikTok.

Tahun lalu, Reddit umumkan kalau mereka bakal nge-charge akses ke API-nya. Dulu ini gratis dan bisa dipakai pengguna untuk bikin aplikasi aksesibilitas. Juga dipakai moderator subreddits (komunitas kecil tentang topik tertentu) untuk bikin alat.

Secara keseluruhan, Reddit punya banyak konten pengguna yang netral. Mulai dari game sampai resep. Tapi Reddit juga terkenal dengan kejujurannya.

Google bisa aja melatih model-model AI-nya dengan data yang NSFW (Not Safe For Work) atau menyinggung. Pengembang AI Google mungkin bakal pakai metode untuk hindari konten berbahaya. Tapi ada kemungkinan ada postingan yang lolos.

Pengguna Reddit langsung sadar akan hal ini. Banyak yang bilang di subreddit R/Google kalau model-model AI harus dilatih untuk keamanan dan nggak toksik. Beberapa pengguna iseng bandingin hasil AI nanti sama r/SubredditSimulator.