Mau Tahu Bagaimana Cara Kerja Search Engine Google?

19 Mar 2012 10:00 5676 Hits 0 Comments Approved by Plimbi
Search engine Google telah hadir dalam waktu yang cukup lama untuk membantu kita mempermudah penelusuran berbagai macam situs di dunia maya. Tapi tahukah Anda bagaimana cara kerja search engine Google setelah menggunakannya selama bertahun-tahun? Berikut penjelasan dari Ben Gomes, salah satu elite engineers yang menangani never-ending array yang merupakan otak dari search engine Google.

Search engine Google telah hadir dalam waktu yang cukup lama untuk membantu kita mempermudah penelusuran berbagai macam situs di dunia maya. Tapi tahukah Anda bagaimana cara kerja mesin pencari Google setelah Anda menggunakannya selama bertahun-tahun? Berikut penjelasan dari Ben Gomes, salah satu elite engineer yang menangani never-ending array yang merupakan otak dari search engine Google.

The Index

Dari mana pencarian dimulai? Perjalanan pencarian dimulai jauh sebelum pengguna telah mengetikkan kata pencarian (query) atau bahkan berpikir tentang kata pencarian. Langkah pertama dari perjalanan ini adalah menelusuri (crawling) dan mengindeks konten Web. Search engine Google telah mengindeks puluhan hingga ratusan miliar halaman. Ketika Ben Gomes pertama kali tiba di Google pada 1999, indeks sudah mencapai sekitar 50 juta halaman, dan itu adalah indeks terbesar saat itu. Sulit untuk membayangkan, tetapi indeks telah tiga kali lipat lebih besar hari saat ini. Pertumbuhan pesat semacam ini di dunia teknologi, apalagi website, adalah hal yang biasa, tetapi tiga lipat masih merupakan angka yang menakjubkan.

Cara kerja search engine Google memiliki sistem di mana sistem tersebut dengan cepat menelusuri konten suatu website yang cepat berubah. Sementara, konten yang tidak berubah terlalu cepat, search engine Google tidak akan sering menelusurinya. Dan kini, search engine Google menjadi makin baik untuk membawa data dari web ke pengguna dalam waktu yang sangat singkat. Ketika Ben Gomes pertama kali bergabung dengan Google, butuh waktu sekitar sebulan untuk menelusuri dan membangun indeks 50 miliar halaman web. Kini, dengan real-time search, kinerja semacam ini bisa diselesaikan dalam waktu kurang dari satu menit.

Indeks dari search engine Google ini seperti indeks yang ada di buku, tapi karena memiliki jumlah yang begitu besar, indeks search engine Google jauh lebih kompleks dari itu. Anda dapat menganggapnya seperti ini: misalnya Anda harus mengindeks sejumlah besar buku dalam perpustakaan, namun tidak hanya berdasarkan judul dan kategori, tetapi juga konten per halaman dari masing-masing buku, dan Anda harus melakukan ini berulang kali dalam sehari. Apa yang akan Anda lakukan untuk mengaturnya hingga optimal, agar pengunjung perpustakaan bisa dengan mudah dan cepat.

Membangun indeks search engine Google adalah seperti itu. Kita harus mengaturnya sedemikian rupa hingga membangun hasil halaman bisa dengan cepat dilakukan saat pengguna memintanya. Jadi, ketika Anda mengetikkan kata pencarian "gadget" dan dalam sepersekian detik, Anda mendapatkan halaman hasil pencarian yang mengatakan, "Kami menemukan 52 juta halaman yang cocok, dan inilah 10 besar, dan inilah seribu halaman lainnya. "Itu adalah ide dari keseluruhan sistem search engine Google.

The Query

Jadi apa otak di balik sistem search engine Google? Ranking adalah otak di balik sistem search engine Google. Apa yang dilakukan adalah, ia mencari berdasarkan lebih dari 200 sinyal tertentu untuk menentukan halaman mana yang paling relevan dengan kata pencarian khusus pengguna. Jadi saat pengguna mulai mengetikkan dalam kotak pencarian, pengguna bisa melihat auto-completions. Ini adalah prediksi dari apa yang mungkin pengguna ingin ketik. Dan dengan Google Instant, kita mulai memberikan hasil aktual saat itu juga. Hal ini memungkinkan pengguna untuk merumuskan kata pencarian dengan cepat.

Jadi saat Anda mulai mengetik "owl", dan dalam pikiran Anda adalah tentang burung hantu. Tapi ternyata "owl" juga mengacu pada Online Writing Lab di Purdue, dan mengacu pada hal-hal lain di web yang dibicarakan oleh orang lain ketika mereka menggunakan kata "owl”. Jadi setelah Anda mengetikkan "owl bird", baru kemudian Anda mendapatkan apa yang Anda inginkan.

Google Instant memungkinkan Anda untuk merumuskan kata pencarian yang lebih baik dengan membiarkan Anda melihat hasil bahkan saat Anda mengetik. Fitur ini menyediakan umpan balik yang memungkinkan Anda untuk memahami apa yang web katakan.

Understanding The Query

Bagaimana cara Google memahami kata pecarian? Kata pencarian dikirim kembali ke Google melalui Internet. Biasanya, ini adalah perjalanan lebih dari 750 mil di kedua arah. Google memiliki pusat data di seluruh dunia, tetapi, rata-rata, kata pencarian menempuh perjalanan sekitar 1.500 mil. Di balik itu, semua pekerjaan pengaturan indeks yang telah dilakukan sekarang mulai memainkan perannya. search engine Google akan mengurai kata pencarian, memahami apa maksud pengguna, mungkin juga mempersonalisasi hasil, dan kemudian mengirimnya ke indeks raksasa Google dan mendapatkan kembali hasil teratas untuk kata pencarian pengguna.

Selain hasil itu sendiri, search engine Google juga perlu menciptakan penyajian dari hasil tersebut, judul dan apa yang disebut "snippets", potongan dua baris teks dari halaman web hasil pencarian. Untuk melakukan hal ini, search engine Google melihat salinan web yang diambil dan menemukan bagian yang paling relevan dari setiap halaman, memunculkan dua baris paling relevan untuk kata pencarian pengguna dan menunjukkan menunjukkan hasil tersebut kepada pengguna.

Proses ini adalah jumlah besar suatu komputasi atau perhitungan. Proses ini mulai dari beberapa kata pencarian yang Anda ketik ke dalam halaman hasil yang Google temukan, dan kemudian bagian mana pada halaman tersebut yang paling relevan dengan kata pencarian pengguna. Dalam kasus Google Instant, search engine Google melakukan hal itu saat pengguna mengetik, sehingga seluruh proses ini makin kompleks. Jadi ini proses menentukan ranking yang kompleks ini terjadi di saat pengguna mengetik.

Kemudian, pada akhir dari proses, pengguna mendapatkan halaman hasil yang disajikan secara indah. Overall, search engine Google menempatkan sejumlah besar upaya dalam mempercepat koneksi antara otak Anda dan informasi yang Anda cari.

Personalization

Bagaimana pencarian dapat dipersonalisasi untuk pengguna? Sebenarnya hal ini terjadi pada setiap tahap. Ketika Anda mulai mengetik kata pencarian, jika Anda sign in, auto-completions akan mereferensikan pada kata pencarian yang pernah Anda ketik sebelumnya. Jika Anda berada dalam wilayah tertentu, search engine Google akan mereferensikan kata pencarian yang masuk akal bagi Anda di wilayah tersebut.

Pada tahap kedua dari proses, ketika search engine Google memproses permintaan Anda, ia juga memperhitungkan "history” dari web browser Anda dan hal serupa lainnya untuk menebak maksud Anda. Selama penentuan ranking, proses akan benar-benar memperhatikan dokumen, search engine Google juga memperhitungkan hal yang masuk akal bagi Anda berdasarkan akun pribadi Anda apabila sign in, dengan melihat dan mempertimbangkan sejarah dari pencarian Anda dalam akun pribadi tersebut. Dan pada akhirnya, ketika search engine Google memiliki set lengkap dari hasil pencarian yang terkumpul, ia kemudian menyesuaikan hasil tersebut untuk Anda.

Jadi personalisasi hasil Anda tertanam dalam proses pencarian. Beberapa personalisasi tersebut memberikan Anda konteks yang tepat untuk hal-hal seperti tanggal dan tempat, dan beberapa di antaranya adalah personalisasi berdasarkan permintaan sebelumnya dan sebagainya.

The Changing Web And The Future

Sifat dari web selalu berubah. Lebih dinamis, lebih fokus pada aplikasi, dan sifat seperti sekelompok halaman semakin berkurang. Bagaimana Google menyesuaikan diri dengan perubahan itu?

Terdapat kelas informasi besar yang tetap sebagai konten di Web. Dalam beberapa kasus informasi ini mungkin tertanam dalam aplikasi Flash dan sebagainya, dan yang search engine Google lakukan adalah mengekstrak informasi dari halaman Flash, PDF, dan hal-hal semacam itu.

Beberapa hal lain yang sebenarnya bersifat aplikasi penuh dan tidak masuk akal untuk mengindeks mereka dengan teknik tradisional. Misalnya, tidak masuk akal untuk mengindeks halaman acak agar kita dapat menemukan tentang jadwal penerbangan, mereka sudah kadaluarsa sehingga membuatnya tidak terlalu relevan. Dalam kasus tersebut, search engine Google akan memahami data yang lebih fundamental. search engine Google bisa mendapatkan data yang ekivalen melalui "feed” dari situs tersebut, dan kemudian dapat mengindeks data secara berdampingan.

Dalam beberapa kasus di mana kita benar-benar mengetahui jenis tertentu dari pengetahuan yang Anda inginkan, misalnya, Anda ingin mengetahui puncak Empire State Building, search engine Google akan mensintesis jawaban dari hasil pencarian dan kemudian menampilkan ketinggian yang sebenarnya. Itu adalah arah di mana search engine Google akan berkembang di masa depan. Perkembangan yang sedang disiapkan search engine Google adalah adalah bergerak dari hanya menyajikan informasi dari data di Web, menuju ke pengetahuan aktual yang bisa menjawab pertanyaan yang Anda minta.

Prinsip search engine Google di sini adalah memberikan pengguna informasi yang mereka inginkan secepat mungkin. search engine Google menyediakan cara mudah bagi pengguna untuk mendapatkan fakta cepat. [RY]

About The Author

Plimbi Editor 999
Administrator

Plimbi Editor

Plimbi Chief Editor
Plimbi adalah tempat menulis untuk semua orang.
Yuk kirim juga tulisanmu sekarang
Submit Artikel