Cara kerja algoritme Penelusuran

Dengan jumlah informasi yang tersedia di web, hampir mustahil untuk menemukan apa yang Anda butuhkan tanpa adanya bantuan untuk memilahnya. Sistem peringkat Google mengurutkan ratusan miliar halaman web di indeks Penelusuran untuk memilah hasil yang berguna dan paling relevan bagi Anda hanya dalam sekejap, serta menampilkannya dengan cara yang mempermudah Anda dalam menemukan apa yang dicari.

Sistem peringkat ini tidak hanya terdiri dari satu, namun serangkaian algoritme. Untuk memberikan informasi yang paling berguna kepada Anda, algoritme Penelusuran melihat banyak faktor, termasuk kata dalam kueri Anda, relevansi dan kegunaan halaman, keahlian sumber, serta lokasi dan setelan Anda. Bobot yang diterapkan untuk setiap faktor berbeda-beda bergantung pada sifat kueri Anda, misalnya, kebaruan konten sangat berpengaruh dalam menjawab pertanyaan tentang topik berita terkini daripada tentang definisi kamus.

Untuk membantu memastikan algoritme Penelusuran memenuhi standar relevansi dan kualitas yang tinggi, kami memiliki proses ketat yang melibatkan pengujian langsung dan ribuan Penilai Kualitas Penelusuran eksternal terlatih dari seluruh dunia. Penilai Kualitas ini sesuai dengan pedoman ketat yang menentukan tujuan kami untuk algoritme Penelusuran dan dapat dilihat oleh siapa saja.

Pelajari lebih lanjut di bawah tentang faktor utama yang membantu menentukan hasil yang ditampilkan untuk kueri Anda:

  • Menganalisis kata penelusuran

    Menganalisis kata penelusuran

    Memahami maksud penelusuran Anda adalah hal yang penting untuk menampilkan jawaban yang baik. Karena itu, untuk menemukan halaman dengan informasi yang relevan, langkah pertamanya adalah menganalisis arti dari kata di kueri penelusuran Anda. Kami membuat model bahasa untuk memahami kata yang harus kami cari di indeks.

    Hal ini mencakup langkah-langkah yang tampaknya semudah menafsirkan kesalahan eja, dan termasuk mencoba memahami jenis kueri yang telah Anda masukkan dengan menerapkan beberapa riset terkini tentang pemahaman bahasa secara alami. Misalnya, sistem persamaan kata kami membantu Penelusuran mengetahui maksud Anda, meskipun 1 kata memiliki beberapa definisi. Sistem ini telah dikembangkan lebih dari 5 tahun dan memperbaiki hasil secara signifikan di lebih dari 30% penelusuran dalam berbagai bahasa.

    Kami juga mencoba memahami kategori informasi yang sedang Anda cari. Apakah merupakan penelusuran yang sangat spesifik atau kueri yang luas? Apakah ada kata seperti “ulasan”, “gambar”, atau “jam buka” yang menunjukkan kebutuhan informasi spesifik di balik penelusuran? Apakah Anda mencari kata kunci yang lagi ngetren yang mengartikan bahwa Anda menginginkan konten yang dipublikasikan pada hari itu? Atau, apakah Anda mencari bisnis terdekat dan menginginkan info lokal?

    Dimensi yang sangat penting dari kategorisasi kueri ini adalah analisis kami terkait apakah kueri Anda mencari konten baru. Jika Anda menelusuri kata kunci populer, algoritme kebaruan kami akan menafsirkannya sebagai tanda bahwa informasi terbaru mungkin lebih berguna dibandingkan halaman yang lebih lama. Artinya saat Anda menelusuri “skor Liga 1 Indonesia”, hasil “Dangdut Academy Asia”, atau “Kabinet Indonesia Maju”, Anda akan melihat informasi terbaru.

  • Mencocokkan penelusuran Anda

    Mencocokkan penelusuran Anda

    Selanjutnya, kami mencari halaman yang berisi informasi yang cocok dengan kueri Anda. Saat Anda mencari, di tingkat yang paling dasar, algoritme kami mencari istilah penelusuran Anda di indeks untuk menemukan halaman yang sesuai. Algoritme menganalisis frekuensi dan lokasi kata kunci tersebut muncul di halaman; dalam judul atau header, atau dalam isi teks.

    Sinyal paling dasar yang informasinya relevan adalah saat halaman web berisi kata kunci yang sama dengan kueri penelusuran Anda. Jika kata kunci tersebut muncul di halaman, atau jika kata kunci tersebut muncul di bagian judul atau isi teks, informasi tersebut cenderung relevan. Selain pencocokan kata kunci sederhana, kami menggunakan data interaksi yang diagregasi dan dianonimkan untuk menilai apakah hasil penelusuran relevan dengan kueri. Kami mengubah data tersebut menjadi sinyal yang membantu sistem machine learning memperkirakan relevansi dengan lebih baik.

    Selain mencocokkan kata kunci, algoritme kami mencari petunjuk untuk mengukur seberapa baik potensi hasil penelusuran menampilkan hal yang dicari pengguna. Saat menelusuri “anjing”, Anda mungkin tidak menginginkan halaman yang berisikan ratusan kata “anjing” di dalamnya. Kami mencoba mencari tahu apakah halaman berisi jawaban atas kueri Anda, dan bukan hanya mengulangi kueri tersebut. Jadi, algoritme Penelusuran mengalisis apakah halaman menyertakan konten yang relevan — seperti gambar, video, atau bahkan daftar ras anjing. Terakhir, kami memeriksa apakah halaman ditulis dalam bahasa yang sama dengan pertanyaan Anda, untuk memprioritaskan halaman yang menggunakan bahasa pilihan Anda.

    Sangat penting untuk diperhatikan bahwa, meskipun sistem kami mencari jenis sinyal yang dapat diukur ini untuk menilai relevansi, sistem ini tidak dirancang untuk menganalisis konsep subjektif, seperti sudut pandang atau kecenderungan politik dari konten halaman.

  • Memberi peringkat halaman yang berguna

    Memberi peringkat halaman yang berguna

    Untuk kueri pada umumnya, ada ribuan bahkan jutaan halaman dengan informasi yang berpotensi relevan. Jadi, untuk membantu memberi peringkat pertama ke halaman terbaik, kami juga membuat algoritme untuk mengevaluasi seberapa bermanfaat halaman tersebut.

    Algoritme ini menganalisis ratusan faktor yang berbeda untuk memunculkan informasi terbaik yang dapat ditawarkan internet, mulai dari keterkinian konten, hingga frekuensi istilah penelusuran Anda muncul dan apakah halaman memberikan pengalaman pengguna yang baik atau tidak. Untuk menilai keterpercayaan dan keabsahan halaman terkait materi yang dibahas, kami mencari situs yang tampaknya dianggap penting oleh pengguna untuk kueri yang serupa. Jika situs terkemuka lain yang membahas materi tersebut menautkan ke halaman, berarti informasi tersebut berkualitas tinggi.

    Terdapat banyak situs di internet yang berisi spam, yang mencoba meraih hasil penelusuran teratas menggunakan teknik seperti terus mengulangi kata kunci atau membeli link yang lolos PageRank. Situs ini memberikan pengalaman pengguna yang sangat buruk, bahkan dapat membahayakan atau menyesatkan pengguna Google. Jadi, kami membuat algoritme untuk mengidentifikasi spam dan menghapus situs yang melanggar panduan webmaster Google dari hasil.

    Konten di web maupun ekosistem informasi secara lebih luas terus mengalami perubahan. Oleh karena itu, kami tidak hentinya mengukur serta menilai kualitas sistem kami untuk memastikan keseimbangan antara relevansi dan keabsahan informasi, agar hasil penelusuran yang Anda temukan tetap tepercaya.

  • Menampilkan hasil terbaik

    Menampilkan hasil terbaik

    Sebelum menayangkan hasil, kami mengevaluasi bagaimana semua informasi yang relevan saling melengkapi: apakah hanya ada 1 topik di seluruh hasil penelusuran, atau banyak? Apakah halaman yang berfokus pada 1 interpretasi yang sempit terlalu banyak? Kami berusaha memberikan beragam informasi dalam format yang paling berguna untuk jenis penelusuran Anda. Selain itu, seiring dengan berkembangnya internet, kami mengembangkan sistem pemberian peringkat untuk menayangkan hasil yang lebih baik bagi lebih banyak kueri.

    Algoritme ini menganalisis sinyal yang menunjukkan apakah semua pengguna dapat melihat hasilnya, seperti apakah situs muncul dengan benar di browser lain; apakah situs dirancang untuk semua jenis dan ukuran perangkat, termasuk dekstop, tablet, dan smartphone; dan apakah waktu pemuatan halaman berfungsi dengan baik bagi pengguna dengan sambungan internet yang lambat.

    Karena pemilik situs dapat menyempurnakan kegunaan situs mereka, kami berupaya dengan keras untuk memberi tahu pemilik situs sebelum melakukan perubahan signifikan dan dapat ditindaklanjuti ke algoritme Penelusuran kami. Misalnya, pada bulan Januari 2018, kami mengumumkan bahwa algoritme kami akan mulai mempertimbangkan "kecepatan halaman" situs, enam bulan sebelum perubahan diterapkan. Untuk membantu pemilik situs, kami menyediakan fitur dan panduan mendetail seperti PageSpeed Insights dan Webpagetest.org sehingga pemilik situs dapat melihat (jika ada) apa yang perlu mereka sesuaikan untuk membuat situs lebih mobile-friendly.

    Anda dapat menemukan informasi selengkapnya tentang fitur dan tips yang diberikan oleh Google kepada pemilik situs di sini.

  • Mempertimbangkan konteks

    Mempertimbangkan konteks

    Informasi seperti lokasi Anda, histori penelusuran sebelumnya, dan setelan Penelusuran, semuanya membantu kami menyesuaikan hasil Anda dengan hal yang paling berguna dan relevan untuk Anda saat itu.

    Kami menggunakan informasi lokasi dan negara untuk menayangkan konten yang relevan untuk area Anda. Misalnya, jika Anda berada di Chicago dan mencari “football”, kemungkinan besar Google akan menampilkan hasil tentang football Amerika dan Chicago Bears akan ditampilkan pertama. Sedangkan, jika Anda mencari “football” di London, Google akan memberi peringkat yang lebih tinggi pada hasil tentang sepak bola dan Liga Primer Inggris. Setelan Penelusuran juga merupakan indikator yang penting untuk menampilkan hasil yang tampaknya berguna bagi Anda, seperti jika Anda menyetel bahasa pilihan atau ikut serta dalam SafeSearch (fitur yang membantu memfilter hasil eksplisit).

    Di beberapa kasus, kami juga mempersonalisasi hasil menggunakan informasi tentang aktivitas Penelusuran terbaru Anda. Misalnya, jika Anda mencari “Barcelona” dan baru-baru ini Anda mencari “Barcelona vs Arsenal”, ini bisa menjadi petunjuk penting bahwa Anda menginginkan informasi tentang klub sepak bola, bukan tentang kota. Anda dapat mengontrol aktivitas penelusuran yang digunakan untuk meningkatkan pengalaman Penelusuran, termasuk menyesuaikan data yang disimpan ke akun Google, di myaccount.google.com.

    Penelusuran juga menyertakan beberapa fitur yang mempersonalisasi hasil berdasarkan aktivitas di akun Google Anda. Misalnya, jika Anda menelusuri “acara di sekitar saya”, Google dapat menyesuaikan beberapa rekomendasi untuk kategori acara yang mungkin Anda minati. Sistem ini dirancang agar sesuai dengan minat Anda, tetapi tidak dirancang untuk menyimpulkan karakteristik sensitif, seperti ras, agama, atau partai politik.

    Anda dapat mengontrol aktivitas penelusuran yang digunakan untuk menyempurnakan pengalaman Penelusuran, termasuk menyesuaikan data yang disimpan ke akun Google, di myaccount.google.com. Untuk menonaktifkan personalisasi Penelusuran berdasarkan aktivitas di akun Anda, nonaktifkan Aktivitas Web & Aplikasi.