Baidu Baike Blokir Google dan Bing



Baidu Baike Blokir Google dan Bing - picture origin: artificialintelligence-news - pibitek.biz - Akses

picture origin: artificialintelligence-news


336-280
TL;DR
  • Baidu memblokir akses Google dan Bing ke data Baidu Baike.
  • Melindungi data besar untuk melatih model AI dan aplikasi.
  • Membatasi akses mesin pencari besar seperti Google dan Bing.

pibitek.biz -Baidu, mesin pencari terbesar di China, baru-baru ini membuat keputusan yang cukup mengejutkan. Mereka memblokir Google dan Bing dari mengakses konten di layanan mereka yang mirip Wikipedia, Baidu Baike. Perubahan ini terlihat jelas pada pembaruan terbaru file robots. txt di Baidu Baike, yang melarang akses crawler Googlebot dan Bingbot. Sebelumnya, Google dan Bing bebas menjelajahi dan mengindeks hampir 30 juta entri di Baidu Baike. Namun, Baidu akhirnya menarik izin tersebut pada 8 Agustus lalu.

Keputusan ini datang di tengah maraknya permintaan akan data besar untuk melatih model dan aplikasi AI. Baidu rupanya ingin melindungi aset digital mereka. Mereka bukan satu-satunya perusahaan yang melakukan hal serupa. Pada bulan Juli, Reddit juga memblokir banyak mesin pencari, kecuali Google, dari mengakses postingan dan diskusi di platformnya. Google memiliki kesepakatan finansial dengan Reddit untuk mengakses data guna melatih layanan AI mereka. Microsoft juga sempat mempertimbangkan untuk membatasi akses data pencarian internet untuk pesaing mereka, terutama yang menggunakan data tersebut untuk membangun chatbot dan layanan AI Generatif.

Namun, Wikipedia versi China, dengan 1.43 juta entri, masih tetap terbuka untuk akses mesin pencari. Sebuah survei oleh South China Morning Post menemukan bahwa entri dari Baidu Baike masih muncul dalam hasil pencarian Bing dan Google. Kemungkinan besar, mesin pencari tersebut masih menggunakan konten lama yang tersimpan dalam cache. Keputusan Baidu untuk memblokir akses ke konten Baidu Baike untuk mesin pencari besar menunjukkan betapa pentingnya data di era AI. Perusahaan-perusahaan berinvestasi besar-besaran dalam pengembangan AI, sehingga nilai dari dataset besar yang terkurasi semakin meningkat.

Perubahan ini juga memengaruhi cara platform online mengelola akses ke konten mereka. Banyak platform memilih untuk membatasi atau memonetisasi akses ke data mereka. Masa depan AI masih penuh misteri, namun satu hal yang pasti: perusahaan-perusahaan akan terus mengevaluasi kebijakan berbagi data mereka. Perubahan ini akan berdampak besar pada cara informasi diindeks dan diakses di internet. Baidu mungkin hanya satu dari banyak perusahaan yang akan mengikuti langkah serupa. Di masa depan, kita mungkin melihat lebih banyak platform online yang membatasi akses ke data mereka.