Beberapa minggu lalu kita dihebohkan oleh berita yang tidak berfaedah, yaitu munculnya foto Prof. Amin Rais dikala kita menulis kata ‘set*n’ di mesin pencari google. Sengaja saya menulisnya tidak lengkap, saya menggunakan simbol ‘ * ‘ untuk mengganti huruf ‘a’. Dan silakan simpulkan sendiri jawabanya setelah selesai membaca. Gambar di bawah ini adalah bukti jejak digital yang saya ambil dari media online kumparan. Di media online itu sebenarnya sudah dijelaskan kenapa hal itu bisa terjadi. Intinya adalah karena teknologi SEO (Search Engine Optimization) dimana karena banyaknya orang me-mantion, membicarakan hal tersebut di media online seperti twitter, facebook dan juga oleh berbagai media yang memuat pernyataan beliau maka akan terkumpul, terindex dan pada akhirnya terangking secara otomatis di mesin pencari semacam google.com.
![]() |
Sumber: Kumparan |
Di dalam SEO, kita mengenal 3 komponen pembentuknya, mereka bekerja dengan cara mengambil, menyimpan, menganalisis dan pada akhirnya membuat ranking otomatis. Semuanya dilakukan oleh ‘robot digital’. Di dalam bahasa aslinya disebut dengan crawling, indexing, dan ranking. Mekanisme yang sama juga digunakan untuk mengindex dan meranking artikel jurnal ilmiah baik yang dilakukan oleh scopus.com, researchgate, atau google scholar. Termasuk Indonesia juga memilikinya sebut saja Indonesian Publication Index, Sinta, dan lain-lain. Khusus mengenai jurnal ini akan dibahas di bagian lain dari tulisan sederhana ini.
Kembali ke SEO! Seperti yang sudah disinggung di atas, kita mengetahui ada 3 tahap pekerjaan yaitu crawling, indexing dan ranking. Satu persatu saya coba bahas. Merujuk pada penjelasan Adam Shore melalui tulisannya yang berjudul Search Engine Basic: Crawling, Indexing & Ranking dia menjelaskan secara umum mengenai 3 faktor kunci SEO ini, yaitu:
- Crawling, ini adalah tahap awal robot digital bekerja. Mereka melakukan ‘crawling’ yaitu berupa mencari, mencatat dan menghimpun seluruh informasi di internet meliputi update berita terbaru, website yang baru lahir hingga link suatu alamat web yang tidak aktif lagi (dead link). Untuk melakukan pekerjaan ini mesin pencari menggunakan program yang sering disebut ‘bot’, ‘spider’, atau ‘crawler’. Ketiga program ini memiliki tipe masing-masing. Khusus google mereka menggunakan ‘spider’ sebagai program pencarinya (lihat video di bawah). Sesuai dengan algoritma yang dirancang sebelumnya, mereka melakukan pekerjaan ‘data mining’. Sebagai contoh data yang ambil adalah judul berita, keyword atau label dan penulisnya. Maka bot, crawler maupun spider akan melakukan pekerjaan menghimpun dan mengkoleksi seluruh penulis, judul, dan label. Seluruh link terbaru akan diambil. Pekerjaan selanjutnya adalah indexing.
- Indexing, membuat indek atau memberikan label pada setiap informasi. Dilakukan klasifikasi data dan informasi digital yang sangat banyak itu. Bukan lagi ratusan atau jutaan tetapi milyaran data dan informasi di dunia ini. Inilah kenapa sekarang muncul diskusi baru mengenai ‘Big Data’, bukan data yang kapasitasnya besar tetapi karena kompleknya data dan sumber data. Indexing bersifat ‘merapikan’ sesuai dengan kategorinya. Dia akan mengkompilasi data dan juga lokasinya untuk setiap ‘kata’, ‘halaman’, hingga ‘link’ alamat aslinya. Kemudian proses analisis dilakukan dengan cara menyetor ke database, mengorganisasi dan pada akhirnya analisis atau interpretasi data. Sama halnya dikala kita melakukan penelitian bukan? Itu dilakukan berdasarkan algoritma khusus sesuai dengan tujuannya. Semakin banyak orang menulis kata tertentu, atau mungkin me-reshare suatu berita maka secara otomatis akan terkompilasi dan terindek. Re-share sama juga dengan copy-paste data bukan? Kita share informasi orang lain, itu sama halnya dengan kita meng-copy kemudian mem-paste informasi itu di web, atau micro blogging macam twitter kita. Artinya, informasi yang sama akan muncul beberapa kali hingga jutaan kali. Informasi yang ter-copy atau ter-reshare berjuta-juta kali ini juga di crawling dan diindex oleh mesin mencari. Itulah kenapa google menjadi ‘mesin pintar’ yang terus belajar dari para penggunanya. Dari jutaan informasi terindex itu secara otomatis mesin pencari bisa melakukan tahap selanjutnya yaitu ranking menjadikannya tranding topic.
- Ranking, inilah yang menjadi perhatian banyak orang. Terkadang ranking memang diciptakan bahkan dikampanyekan dengan tujuan untuk kepentingan tertentu. Mungkin kita masih ingat bagaimana perang tagar terjadi di twitter. Tagar #2019Gantixxxxx terus dikampanyekan dengan harapan bisa terus memuncaki ranking pembicaraan dan searching. Setiap kata kunci yang kita ketik di box search engine, google secara otomatis akan memberikan rekomendasi melalui kata yang paling banyak dicari. Darimana google tau itu? Dari indexing kata dan link yang ada direpositori google tentunya. Artinya dikala kita mencari berita di internet menggunakan bantuan google, sebenarnya tidak benar-benar mencarinya, tetapi justru menemukan artikel yang sudah terindek oleh google.
Penjelasan crawling di google.com
Berita ‘set*n’ yang memunculkan Prof. Amin Rais ini sebenarnya bukan kali pertama. Akhir tahun 2016 sebenarnya juga pernah terjadi di kala kita memasukkan kalimat ‘sungai bersih karena foke’ tetapi google memberikan saran/ suggestion dengan menggantikan kata ‘foke’ menjadi ‘ahok’.