Kako funkcioniraju algoritmi Pretraživanja

Uz tako veliku količinu informacija na webu bilo bi gotovo nemoguće pronaći ono što trebate bez određene pomoći u njihovom razvrstavanju. Googleovi sustavi rangiranja osmišljeni su upravo za tu svrhu, a to je razvrstati stotine milijardi web-stranica u našem indeksu Pretraživanja kako bi u djeliću sekunde pronašli najrelevantnije i najkorisnije rezultate te ih predstavili na način da možete lakše pronaći ono što tražite.

Sustavi rangiranja sačinjeni su od ne samo jednog, već čitavog niza algoritama. Kako bi vam pružili najkorisnije informacije, algoritmi Pretraživanja sagledaju mnoge čimbenike, uključujući riječi vašeg upita, relevantnost i korisnost stranica, stručnost izvora te vašu lokaciju i postavke. Težina koja se pridaje pojedinom čimbeniku ovisi o naravi vašeg upita — na primjer, recentnost sadržaja ima veću ulogu pri odgovaranju na upite o aktualnim temama vijesti nego u slučaju rječničkih definicija.

Kako bi algoritmi Pretraživanja ispunjavali visoke standarde relevantnosti i kvalitete, imamo strogi postupak koji obuhvaća testiranja uživo i tisuće posebno obučenih vanjskih ocjenjivača kvalitete Pretraživanja iz cijelog svijeta. Ocjenjivači kvalitete slijede stroge smjernice koje definiraju naše ciljeve za algoritme Pretraživanja i koje su javno dostupne.

U nastavku saznajte više o ključnim čimbenicima na temelju kojih se prikazuju rezultati za vaš upit:

  • Analiziranje vaših riječi

    Analiziranje vaših riječi

    Za dobivanje relevantnih odgovora na vaše upite ključno je da razumijemo što tražite. Zato, da bismo pronašli stranice s relevantnim informacijama, prvi je korak da analiziramo značenje riječi u vašem upitu za pretraživanje. Izrađujemo jezične modele kako bismo pokušali otkriti koje nizove riječi trebamo tražiti u indeksu.

    Ti modeli koji počivaju na najnovijim istraživanjima o razumijevanju prirodnih jezika obavljaju naizgled jednostavne radnje kao što je tumačenje pravopisnih pogrešaka pa sve do prepoznavanja vrste unesenog upita. Na primjer, pomoću našeg sustava sinonima Pretraživanje može prepoznati što tražite, čak i ako riječ ima više značenja. To omogućuje Pretraživanju da na upit „Kako promijeniti žarulju" odgovara sa stranicama koje opisuju kako zamijeniti žarulju. Za razvoj tog sustava bilo je potrebno više od pet godina i znatno je poboljšao rezultate u više od 30% pretraživanja na različitim jezicima.

    Trudimo se razumjeti i koju kategoriju informacija tražite. Je li u pitanju vrlo specifično pretraživanje ili neki širi pojam? Sadrži li upit riječi kao što su „recenzija", „slike" ili „radno vrijeme" koje ukazuju na potrebu za konkretnim informacijama? Je li upit napisan na francuskom, što implicira da želite odgovore na tom jeziku? Ili tražite neku tvrtku u blizini i želite saznati više o njenoj lokaciji?

    Osobito važna dimenzija ove kategorizacije upita jest analiza vašeg upita kako bismo utvrdili tražite li novi sadržaj. Ako pretražujete aktualne ključne riječi, naši algoritmi novosti tumačit će to kao signal da bi ažurne informacije mogle biti korisnije od starijih stranica. To znači da kada pretražujete najnovije "rezultate HNL-a", rezultate "plesa sa zvijezdama" ili "zaradu tvrtke exxon", prikazat će vam se najnovije informacije.

  • Traženje podudarnih rezultata

    Traženje podudarnih rezultata

    Zatim tražimo web-stranice s informacijama koje odgovaraju vašem upitu. Dok pretražujete, naši algoritmi na najosnovnijoj razini traže vaše pojmove za pretraživanje u indeksu kako bi pronašli odgovarajuće stranice. Pritom analiziraju učestalost i mjesto pojavljivanja tih ključnih riječi na stranici, i to u naslovima, zaglavljima i samom tekstu stranice.

    Ako web-stranica sadrži iste ključne riječi kao upit za pretraživanje, to je osnovni signal da su informacije relevantne. Ako se te ključne riječi pojavljuju na stranici ili u naslovima ili tekstu, još je vjerojatnije da su informacije relevantne. Osim jednostavnog podudaranja ključnih riječi upotrebljavamo skupne i anonimizirane podatke o interakciji da bismo procijenili jesu li rezultati pretraživanja relevantni za upite. Te podatke pretvaramo u signale koji našim sustavima za strojno učenje pomažu da bolje procijene relevantnost.

    Osim podudaranja ključnih riječi, algoritmi traže naznake pomoću kojih mogu mjeriti u kojoj mjeri potencijalni rezultati pretraživanja korisnicima daju informacije koje su tražili. Kada postavite upit „psi", vjerojatno ne želite stranicu na kojoj sto puta piše „psi". Pokušavamo otkriti sadrži li stranica odgovor na vaš upit, a ne samo ponavljanja unesenog upita. Tako algoritmi Pretraživanja analiziraju uključuju li stranice relevantan sadržaj, primjerice slike i videozapise pasa ili čak popise pasmina. Naposljetku provjeravamo je li stranica na istom jeziku kao i pitanje kako bismo odredili prioritet stranica prema vašem preferiranom jeziku.

    Važno je napomenuti da naši sustavi traže te vrste mjerljivih signala kako bi procijenili relevantnost, ali ne mogu analizirati subjektivne koncepte kao što su gledište ili političko stajalište sadržaja stranice.

  • Kvaliteta sadržaja

    Kvaliteta sadržaja

    Za prosječan upit postoje tisuće ili čak milijuni web-stranica s potencijalno relevantnim informacijama. Da bismo rangirali web-lokacije tako da one najbolje budu među prvima, pišemo i algoritme koji procjenjuju pouzdanost tih web-stranica.

    Kako bi pronašli najbolje informacije ponuđene na webu, algoritmi analiziraju stotine različitih čimbenika od starosti sadržaja do broja pojavljivanja vaših pojmova za pretraživanje i toga pruža li stranica dobar korisnički doživljaj. U procjeni pouzdanosti i mjerodavnosti za određeni predmet oslanjamo se na web-lokacije za koje se čini da ih mnogi korisnici smatraju korisnima za slične upite. Ako druge istaknute web-lokacije u vezi s tom temom sadrže veze na tu stranicu, to je dobar znak da je kvaliteta informacija visoka.

    Na webu ima mnoštvo neželjenih web-lokacija koje se pokušavaju na prevaru probiti na vrh rezultata pretraživanja koristeći se tehnikama kao što su beskonačno ponavljanje ključnih riječi ili kupnja veza koje prosljeđuju prednosti PageRanka. Te web-lokacije pružaju loš korisnički doživljaj i čak mogu nanijeti štetu Googleovim korisnicima ili ih obmanuti. Zato pišemo algoritme koji otkrivaju neželjeni sadržaj i uklanjaju web-lokacije koje krše Googleove smjernice za webmastere iz rezultata pretraživanja.

    Sadržaj na webu i širi ekosustav informacija neprestano se mijenjaju, stoga neprekidno mjerimo i procjenjujemo kvalitetu svojih sustava kako bismo postigli pravu ravnotežu relevantnosti i mjerodavnosti informacija i tako vam pružili rezultate kojima možete vjerovati.

  • Prikaz najboljih rezultata

    Prikaz najboljih rezultata

    Prije nego što vam prikažemo rezultate, procjenjujemo međuodnose svih relevantnih informacija: Je li u rezultatima pretraživanja prisutna samo jedna tema ili više njih? Postoji li previše stranica u čijem je fokusu samo jedno usko tumačenje? Nastojimo pružiti raznovrstan skup informacija u oblicima koji su najkorisniji za vašu vrstu pretraživanja. A usporedno s razvojem weba i mi razvijamo svoje sustave rangiranja kako bismo posluživali bolje rezultate za više upita.

    Algoritmi analiziraju signale koji pokazuju mogu li svi naši korisnici vidjeti rezultat, primjerice prikazuje li se stranica ispravno u različitim preglednicima; je li osmišljena za sve vrste i veličine uređaja, uključujući stolna računala, tablete i pametne telefone te funkcioniora li vrijeme učitavanja stranice dobro za korisnike sa sporom internetskom vezom.

    Budući da vlasnici web-lokacija mogu poboljšati iskoristivost svoje web-lokacije, naporno radimo na tome da bismo vlasnike web-lokacija unaprijed obavijestili o značajnim, praktičnim promjenama naših algoritama Pretraživanja. Na primjer, u siječnju 2018. najavili smo da će naši algoritmi početi uzimati u obzir "brzinu stranice" na web-lokacijama, šest mjeseci prije objavljivanja te promjene. Da bismo pomogli vlasnicima web-lokacija, omogućili smo detaljne vodiče i alate kao što su PageSpeed Insights i Webpagetest.org kako bi vlasnici web-lokacija vidjeli što im je potrebno za prilagodbu (ako je primjenjivo) kako bi njihove web-lokacije bile prilagođenije mobilnim uređajima.

    Više informacija o alatima i savjetima koje Google pruža vlasnicima web-lokacija možete pronaći ovdje .

  • Razmatranje konteksta

    Razmatranje konteksta

    Informacije kao što su vaša lokacija, povijest prošlih pretraživanja i postavke Pretraživanja pomažu nam da prilagodimo rezultate prema onome što je u tom trenutku najkorisnije i najrelevantnije za vas.

    Vašu zemlju i lokaciju upotrebljavamo kako bismo vam prikazali sadržaj koji je relevantan za vaše područje. Na primjer, ako ste u Chicagu i tražite „nogomet", Google će vam najvjerojatnije prvo prikazati rezultate o američkom nogometu i Chicago Bearsima. No ako „nogomet" potražite u Londonu, Google će više rangirati rezultate o nogometu i Ligi prvaka. Postavke pretraživanja također su važan pokazatelj toga koji će vam rezultati vjerojatno biti korisni, primjerice ako postavite preferirani jezik ili uključite Sigurno pretraživanje (alat za filtriranje eksplicitnih rezultata).

    U nekim slučajevima možemo i prilagoditi vaše rezultate pomoću podataka o vašoj nedavnoj aktivnosti na Pretraživanju. Na primjer, ako potražite pojam „Barcelona", a nedavno ste tražili „Barcelona – Arsenal", to može biti važna naznaka da ne želite informacije o gradu već nogometnom klubu. Na stranici myaccount.google.com možete odrediti koja će se aktivnost pretraživanja koristiti za poboljšanje vašeg doživljaja na Pretraživanju, a tamo također možete odrediti podatke koji se spremaju na Google račun.

    Pretraživanje sadrži i neke značajke koje prilagođavaju rezultate na temelju aktivnosti na vašem Google računu. Na primjer, ako pretražujete „događaji u blizini", Google može prilagoditi neke preporuke za kategorije događaja za koje mislimo da bi vas mogli zanimati. Ti sustavi osmišljeni su kako bi se podudarali s vašim interesima, ali ne i za pogađanje osjetljivih obilježja kao što su vaša rasa, vjera ili politička stranka.

    Na stranici myaccount.google.com možete odrediti koja će se aktivnost pretraživanja koristiti za poboljšanje vašeg doživljaja na Pretraživanju, a tamo također možete odrediti podatke koji se spremaju na Google račun. Da biste onemogućili prilagodbu Pretraživanja na temelju aktivnosti na računu, isključite Aktivnost na webu i u aplikacijama.