Google Ngintip Website yang Diblokir, Kok Bisa?



Google Ngintip Website yang Diblokir, Kok Bisa? - the picture via: searchenginejournal - pibitek.biz - Data

the picture via: searchenginejournal


336-280
TL;DR
  • Googlebot ngintip halaman website yang diblokir robots.txt
  • Googlebot menghormati tag noindex di halaman diblokir
  • Googlebot menemukan halaman diblokir dengan site: search

pibitek.biz -Pernahkah kamu bertanya-tanya kenapa Google suka ngintip website yang sudah diblokir? Ini kayak lagi main petak umpet, Google berusaha ngintip-ngintip website yang berusaha sembunyi. Google punya robot pintar yang disebut Googlebot, tugasnya adalah menjelajahi website dan mengumpulkan data. Data tersebut kemudian digunakan oleh Google untuk membuat daftar website yang muncul di hasil pencarian. Googlebot ini sebenarnya adalah asisten pribadi Google yang rajin dan cerdas. Googlebot selalu berusaha untuk menjelajahi semua website di dunia maya.

Dalam dunia website, ada aturan main yang disebut robots.txt. Sama seperti aturan main di game, robots.txt menentukan bagian mana dari website yang boleh diakses oleh Googlebot dan bagian mana yang harus dihindari. Googlebot adalah robot yang patuh, dia selalu berusaha untuk mengikuti aturan main yang telah ditetapkan. Googlebot menghormati robots.txt dan tidak akan mengakses halaman website yang diblokir. Googlebot ini pintar dan tidak suka melanggar aturan. Tapi, Googlebot punya kebiasaan usil.

Walaupun suatu website sudah diblokir dengan robots.txt, Googlebot tetap penasaran dan mencoba ngintip. Googlebot suka ngintip halaman website yang terhubung ke website lain, seperti ngintip halaman website yang di-link dari artikel di website lain. Googlebot biasanya ngintip halaman yang mengandung tag noindex. Googlebot memang selalu ingin tahu dan ingin mendapatkan informasi sebanyak-banyaknya. Tag noindex ini kayak kode rahasia yang memberitahu Googlebot untuk tidak menampilkan halaman website di hasil pencarian.

Tag noindex biasanya digunakan untuk memblokir halaman website yang tidak ingin ditampilkan di hasil pencarian, seperti halaman website yang masih dalam tahap pengembangan atau halaman website yang berisi informasi sensitif. Tag noindex ini seperti tanda "dilarang masuk" bagi Googlebot. Googlebot juga punya cara lain untuk menemukan halaman website, yaitu melalui site: search. Site: search adalah fitur Google yang memungkinkan pengguna mencari halaman website di domain tertentu. Misalnya, jika kamu ingin mencari halaman website di domain "www.

example.com", kamu bisa mengetik "site:www. example.com" di kolom pencarian Google. Site: search ini seperti mesin pencari khusus yang hanya fokus pada satu domain website. Tapi, jangan salah! Site: search tidak mencerminkan hasil indeks Google yang sebenarnya. Ini seperti searching di lautan informasi, nggak selalu sesuai dengan kenyataan. Googlebot punya sistem indeksnya sendiri yang jauh lebih kompleks dan akurat dibandingkan site: search. Site: search hanya merupakan alat bantu yang terbatas dan tidak mencerminkan keseluruhan informasi yang dimiliki oleh Googlebot.

Jadi, walaupun Googlebot ngintip halaman website yang diblokir robots.txt, halaman tersebut tidak akan ditampilkan di hasil pencarian jika halaman tersebut sudah diberi tag noindex. Googlebot akan membaca tag noindex dan menghormati aturannya. Googlebot adalah robot yang disiplin dan selalu menjalankan tugasnya dengan baik. Nah, di Search Console, kamu bisa lihat laporan "Indexed, though blocked by robots.txt". Laporan ini menunjukkan bahwa Googlebot telah menemukan dan mengakses halaman website yang diblokir robots.txt.

Tapi jangan khawatir, ini bukan berarti terjadi kesalahan atau harus diperbaiki. Googlebot sudah mencatat tag noindex dan halaman website tersebut tidak akan muncul di hasil pencarian. Googlebot selalu berusaha untuk menjalankan tugasnya dengan baik dan tidak akan pernah mengabaikan perintah yang diberikan. Lalu, apa gunanya laporan "Indexed, though blocked by robots.txt" ini? Laporan ini bisa membantu kamu untuk memantau website dan melihat apakah ada halaman website yang diblokir secara tidak sengaja, sehingga tidak bisa diakses oleh Googlebot.

Laporan ini seperti alarm yang memberi tahu kamu jika terjadi kesalahan. Kesimpulannya, Googlebot memang punya cara tersendiri untuk mengindeks website, termasuk website yang diblokir robots.txt. Googlebot akan menghormati tag noindex dan tidak akan menampilkan halaman website yang diblokir di hasil pencarian. Laporan "Indexed, though blocked by robots.txt" hanyalah informasi tambahan yang bisa membantu kamu memantau website. Googlebot adalah robot yang teliti dan selalu berusaha untuk menjalankan tugasnya dengan baik.

Jadi, kamu tidak perlu khawatir lagi jika melihat laporan ini di Search Console. Google sudah tahu caranya ngatur website agar tetap aman dan sesuai dengan aturan main. Google adalah platform yang selalu berusaha untuk memberikan pengalaman terbaik bagi para penggunanya.