Ako fungujú vyhľadávacie algoritmy

Na internete sa nachádza obrovské množstvo informácií a nájsť tie potrebné by bolo takmer nemožné, keby vám niekto nepomohol s ich usporiadaním. Presne na to slúžia hodnotiace systémy Googlu. Tie prechádzajú stovky miliárd webových stránok a pridávajú ich do indexu Vyhľadávania, aby vám za zlomok sekundy mohli poskytnúť užitočné a relevantné výsledky. Zároveň vám ich prezentujú spôsobom, ktorý vám pomôže nájsť to, čo hľadáte.

Tieto hodnotiace systémy pozostávajú z niekoľkých sérií algoritmov. Algoritmy Vyhľadávania posudzujú mnoho faktorov vrátane slov v dopyte, relevancie a použiteľnosti stránok, odbornosti zdrojov a vašej polohy a nastavení, aby vám poskytli tie najužitočnejšie informácie. Dôraz kladený na každý faktor závisí od povahy vášho dopytu. Čerstvosť obsahu má napríklad väčší význam pri odpovedaní na dopyty týkajúce sa aktuálnych spravodajských tém ako v prípade definícií zo slovníka.

Na zaistenie toho, aby algoritmy Vyhľadávania spĺňali tie najvyššie štandardy relevancie a kvality, používame dôsledný proces zahrnujúci živé testovanie a tisícky vyškolených externých hodnotiteľov kvality Vyhľadávania po celom svete. Títo hodnotitelia kvality prísne dodržiavajú verejné pokyny, ktoré definujú naše ciele pre algoritmy Vyhľadávania.

Nižšie nájdete ďalšie informácie o kľúčových faktoroch pomáhajúcich určiť, ktoré výsledky sa vrátia pre váš dopyt:

 • Analýza vašich slov

  Analýza vašich slov

  Porozumenie významu vášho vyhľadávania je rozhodujúce pre vrátenie dobrých odpovedí. Pri vyhľadávaní stránok s relevantnými informáciami preto ako prvé analyzujeme význam slov vo vyhľadávacom dopyte. Vytvárame jazykové modely, pomocou ktorých sa pokúšame dešifrovať, ktoré reťazce slov by sme mali hľadať v indexe.

  Zahrnuje to kroky, ktoré sú zdanlivo jednoduché, ako je napríklad interpretácia pravopisných chýb, a pokračuje to snahou pochopiť, aký typ dopytu ste zadali, a to použitím najnovších poznatkov z výskumu prirodzeného jazyka. Náš synonymický slovník napríklad pomáha Vyhľadávaniu zistiť, čo dopytom myslíte, a to aj vtedy, ak má slovo viacero definícií. Vývoj tohto systému trval viac ako päť rokov a významne zlepšuje výsledky pre viac ako 30 % vyhľadávaní vo všetkých jazykoch.

  Snažíme sa tiež porozumieť tomu, akú kategóriu informácií hľadáte. Ide o veľmi špecifické vyhľadávanie alebo široký dopyt? Vyskytujú sa v ňom slová, ako napríklad „recenzia“, „fotky“ alebo „otváracie hodiny“, ktoré naznačujú, že hľadáte konkrétne informácie? Hľadáte populárne kľúčové slová, ktoré znamenajú, že požadujete obsah zverejnený v daný deň? Alebo hľadáte firmu v okolí a chcete miestne informácie?

  Obzvlášť dôležitým aspektom tejto kategorizácie dopytov je analýza, či váš dopyt hľadá aktuálny obsah. Ak hľadáte populárne kľúčové slová, algoritmy aktuálnosti to interpretujú ako signál, že aktuálne informácie môžu byť užitočnejšie než staré stránky. Znamená to, že keď budete hľadať aktuálne „skóre zápasov NHL“, výsledky „Superstar“ alebo „zárobky exxonu“, zobrazia sa vám najnovšie informácie.

 • Hľadanie zhôd vyhľadávania

  Hľadanie zhôd vyhľadávania

  Potom hľadáme webové stránky s informáciami, ktoré zodpovedajú vášmu dopytu. Zjednodušene povedané, počas vyhľadávania hľadajú algoritmy vyhľadávacie dopyty v indexe, a tak nájdu príslušné stránky. Analyzujú, ako často a kde sa tieto kľúčové slová vyskytujú na stránke, či už v názvoch, nadpisoch alebo v hlavnom texte.

  Základným signálom relevancie informácií je to, keď webová stránka obsahuje rovnaké kľúčové slová ako váš vyhľadávací dopyt. Ak sa dané kľúčové slová vyskytujú na stránke alebo v nadpisoch či hlavnom texte, je pravdepodobnejšie, že príslušné informácie budú relevantné. Okrem jednoduchých zhôd kľúčových slov používame na hodnotenie relevancie výsledkov k dopytom agregované a anonymizované údaje o interakciách. Tieto údaje prevádzame na signály, ktoré pomáhajú našim systémom so strojovým učením lepšie odhadovať relevanciu.

  Okrem vyhľadávania zodpovedajúcich kľúčových slov hľadajú algoritmy aj stopy na meranie toho, do akej miery poskytujú potenciálne výsledky vyhľadávania používateľom to, čo hľadajú. Keď vyhľadáte dopyt „psy“, zrejme nechcete stránku, na ktorej sa slovo „psy“ nachádza viac ako stokrát. Snažíme sa zistiť, či daná stránka obsahuje odpoveď na váš dopyt, a nie to, či sa na nej tento dopyt iba dookola opakuje. Vyhľadávacie algoritmy preto analyzujú, či stránky zahrnujú relevantný obsah – napríklad obrázky psov, videá alebo dokonca zoznam plemien. Na záver skontrolujeme, či je stránka napísaná v rovnakom jazyku ako vaša otázka, aby sme uprednostnili stránky vo vašom preferovanom jazyku.

  Je dôležité poznamenať, že zatiaľ čo naše systémy hľadajú tieto druhy kvantifikovateľných signálov na posúdenie relevancie, nie sú navrhnuté na analýzu subjektívnych koncepcií, ako je napríklad postoj alebo politická inklinácia obsahu stránky.

 • Hodnotenie užitočných stránok

  Hodnotenie užitočných stránok

  Pre obvyklý dopyt sú k dispozícii tisícky, dokonca aj milióny webových stránok s potenciálne relevantnými informáciami. Takže na to, aby sme pomohli najlepším stránkam zaradiť sa ako prvé, programujeme taktiež algoritmy na hodnotenie ich užitočnosti.

  Tieto algoritmy analyzujú stovky rôznych faktorov, aby sa pokúsili nájsť tie najlepšie informácie, ktoré dokáže internet ponúknuť, od aktuálnosti obsahu, po počet výskytov vyhľadávacích dopytov a údaje o tom, či majú používatelia zo stránky dobrý dojem. Na to, aby sme mohli posúdiť dôveryhodnosť a spoľahlivosť obsahu, hľadáme weby, ktoré mnohí používatelia oceňujú v prípade podobných dopytov. Ak na príslušnú stránku s požadovaným obsahom odkazujú aj ďalšie významné weby, ide o dobré znamenie, že informácie sú kvalitné.

  Na webe sa nachádza veľa spamových stránok, ktoré sa pokúšajú nekalo prebojovať na prvé priečky výsledkov vyhľadávania prostredníctvom techník, ako je opakované používanie rovnakých kľúčových slov či nakupovanie odkazov, ktoré vyhovujú hodnoteniu PageRank. S týmito webmi majú používatelia Google veľmi zlé skúsenosti a môžu im dokonca uškodiť, prípadne ich zavádzať. Preto programujeme algoritmy, ktoré identifikujú spam a odstraňujú weby porušujúce pokyny pre správcov webu od Googlu z našich výsledkov.

  Obsah na internete a širší informačný ekosystém sa neustále menia, a preto priebežne meriame a hodnotíme kvalitu našich systémov, aby sme zabezpečili rovnováhu medzi relevantnosťou a spoľahlivosťou informácií a udržali si vašu dôveru v zobrazené výsledky.

 • Zobrazovanie najlepších výsledkov

  Zobrazovanie najlepších výsledkov

  Pred zobrazením výsledkov zhodnotíme, ako všetky relevantné informácie do seba zapadajú: je medzi výsledkami vyhľadávania iba jedna téma alebo niekoľko? Zameriava sa na jednu úzku interpretáciu príliš veľa stránok? Snažíme sa poskytnúť rôznorodý súbor informácií vo formátoch, ktoré sú najužitočnejšie pre váš typ vyhľadávania. A s vývojom internetu vyvíjame aj systémy hodnotenia, aby sme dosiahli lepšie výsledky pre viac dopytov.

  Tieto algoritmy analyzujú signály, ktoré označujú, či si všetci používatelia môžu zobraziť príslušný výsledok, napríklad či sa web správne zobrazuje v rôznych prehliadačoch, či je navrhnutý pre všetky typy a veľkosti zariadení vrátane počítačov, tabletov a smartfónov a či trvanie načítavania stránok vyhovuje aj používateľom s pomalým internetovým pripojením.

  Vlastníci webových stránok môžu zlepšiť použiteľnosť svojho webu, takže usilovne pracujeme na tom, aby sme ich vopred informovali o významných použiteľných zmenách v našich algoritmoch Vyhľadávania. V januári 2018 sme napríklad oznámili, že algoritmy začnú zohľadňovať „rýchlosť stránky“ webov, a to šesť mesiacov pred uplatnením zmien. Na pomoc vlastníkom webov sme poskytli podrobné pokyny a nástroje, napríklad PageSpeed InsightsWebpagetest.org, aby zistili, ako (a či vôbec) budú musieť svoj web upraviť, aby bol vhodnejší pre mobilné zariadenia.

  Ďalšie informácie o týchto nástrojoch a tipy, ktoré Google poskytuje vlastníkom webov, nájdete tu.

 • Používanie kontextu

  Používanie kontextu

  Informácie, ako sú vaša poloha, predchádzajúca história vyhľadávania a nastavenia Vyhľadávania, nám pomáhajú prispôsobiť výsledky tomu, čo je pre vás v danom momente najužitočnejšie a najrelevantnejšie.

  Vašu krajinu a polohu používame na poskytovanie obsahu, ktorý je relevantný pre vašu oblasť. Ak sa napríklad nachádzate v Chicagu a vyhľadáte dopyt „futbal“, Google vám pravdepodobne najprv zobrazí výsledky o americkom futbale a tíme Chicago Bears. Ak však vyhľadáte dopyt „futbal“ v Londýne, Google na prvých priečkam zobrazí výsledky o klasickom futbale a lige Premier League. Nastavenia Vyhľadávania sú tiež dôležitým indikátorom toho, ktoré výsledky budú pre vás pravdepodobne užitočné, ak napríklad nastavíte preferovaný jazyk či aktivujete Bezpečné vyhľadávanie (nástroj na filtrovanie explicitných výsledkov).

  V niektorých prípadoch môžeme výsledky prispôsobiť aj pomocou informácií o vašej nedávnej aktivite Vyhľadávania. Ak napríklad vyhľadáte výraz „Barcelona“, pričom ste nedávno hľadali dopyt „Barcelona v. Arsenal”, môže to byť dôležitá stopa, že chcete nájsť informácie o futbalovom klube, nie meste. Na adrese myaccount.google.com môžete ovládať, ktorá vyhľadávacia aktivita sa používa na zlepšovanie skúseností s Vyhľadávaním, a zmeniť nastavenia toho, ktoré údaje sa ukladajú do vášho účtu Google.

  Vyhľadávanie tiež zahrnuje niektoré funkcie, ktoré prispôsobujú výsledky na základe aktivity vo vašom účte Google. Ak napríklad vyhľadáte „udalosti v okolí“, Google môže prispôsobiť určité odporúčania podľa kategórií udalostí, ktoré by vás mohli zaujímať. Tieto systémy sú navrhnuté, aby zodpovedali vašim záujmom, ale nepoužívajú na to citlivé údaje, ako sú rasa, náboženstvo alebo politická strana.

  Na adrese myaccount.google.commôžete ovládať, ktorá aktivita Vyhľadávania sa používa na zlepšovanie skúseností s Vyhľadávaním, a zmeniť nastavenia toho, ktoré údaje sa ukladajú do vášho účtu Google. Ak chcete deaktivovať prispôsobovanie Vyhľadávania na základe aktivity vo vašom účte, vypnite aktivitu na internete a v aplikáciách.