Jak fungují algoritmy Vyhledávání

Vzhledem k tomu, jaké množství informací je na webu dostupné, by nalezení těch potřebných bylo téměř nemožné, kdybychom nepomáhali s jejich uspořádáním. Přesně k tomu slouží hodnoticí systémy Google: řadí stovky miliard webových stránek v indexu Vyhledávání, aby vám ve zlomku sekundy poskytly užitečné a relevantní výsledky a prezentovaly je způsobem, který vám pomůže najít, co hledáte.

Tyto hodnoticí systémy nejsou tvořeny jedním, ale celou sérií algoritmů. Při zajišťování co nejužitečnějších informací zohledňují algoritmy Vyhledávání mnoho faktorů, včetně slov zadaných v dotazu, relevance a užitečnosti stránek, odbornosti zdrojů a vaší polohy a nastavení. Váha, kterou tyto faktory budou mít, se liší v závislosti na povaze dotazu – například aktuálnost obsahu hraje větší roli při zodpovídání dotazů ohledně současných zpravodajských témat než při vyhledávání slovníkových definic.

Abychom algoritmům Vyhledávání pomohli zajistit vysoké standardy relevance a kvality, využíváme důkladný proces, který obnáší živé testování i využití tisíců trénovaných externích hodnotitelů kvality Vyhledávání, kteří pocházejí z celého světa. Tito hodnotitelé kvality postupují podle přísných pokynů, které definují cíle algoritmů Vyhledávání a jsou veřejně dostupné všem.

Níže naleznete další informace o hlavních faktorech, které pomáhají určit, jaké výsledky budou na váš dotaz nalezeny:

  • Analýza zadaných slov

    Analýza zadaných slov

    Pro poskytnutí kvalitních odpovědí je nezbytné pochopit význam dotazu. Abychom mohli najít stránky s relevantními informacemi, nejdříve proto analyzujeme, co slova v dotazu znamenají. Pomocí jazykových modelů se snažíme zjistit, jaké řady slov v našem indexu máme hledat.

    Tento proces zahrnuje zdánlivě jednoduché kroky, jako je interpretace překlepů, ale také složité posouzení typu zadaného dotazu na základě nejnovějších poznatků z oblasti chápání přirozeného jazyka. Náš systém pro analýzu synonym nám například pomáhá pochopit, co máte na mysli, i když má slovo několik různých významů. Tento systém, jehož vývoj trval více než pět let, významně zlepšuje výsledky ve více než 30 % vyhledávání ve všech jazycích.

    Snažíme se také pochopit, jaký typ informací hledáte. Jedná se o velmi konkrétní vyhledávání, nebo o obecný dotaz? Obsahuje dotaz slova jako „recenze“, „fotky“ nebo „otevírací doba“, které naznačují, že potřebujete konkrétní informace? Hledáte klíčová slova, která jsou v poslední době populární a mohou znamenat, že si chcete prohlédnout aktuálně publikovaný obsah? Nebo hledáte firmy v okolí a potřebujete místní informace?

    Mimořádně důležitým rozměrem této kategorizace dotazů je analýza, zda vyhledáváte aktuální obsah. Pokud vyhledáváte populární klíčová slova, algoritmy pro aktuálnost to interpretují jako znamení, že nové informace pro vás mohou být užitečnější než starší stránky. To znamená, že pokud vyhledáváte „výsledky Sparty“, „výsledky StarDance“ nebo „příjmy ČEZu“, vždy se zobrazí nejnovější údaje.

  • Vyhledání odpovídajících stránek

    Vyhledání odpovídajících stránek

    Následně vyhledáme webové stránky s informacemi, které odpovídají vašemu dotazu. Na nejzákladnější úrovni naše algoritmy v indexu vyhledají zadané výrazy a najdou tak příslušné stránky. Analyzují také, jak často a kde na stránce se daná klíčová slova vyskytují – mohou se vyskytovat například v názvech, nadpisech nebo hlavním textu.

    Základním faktorem relevance je, když stránka obsahuje stejná klíčová slova jako vyhledávací dotaz. Pokud se tato klíčová slova zobrazují na stránce nebo v jejím záhlaví či textu, informace nejspíš budou relevantní. Kromě prostého hledání shody klíčových slov používáme k vyhodnocování relevance také agregovaná a anonymizovaná data o interakcích. Tato data přetransformujeme na indikátory, které našim systémům se strojovým učením pomohou odhadnout relevanci.

    Kromě klíčových slov hledají algoritmy také signály, jak moc potenciální výsledky vyhledávání uživatelům poskytnou to, co hledají. Když hledáte výraz „psi“, pravděpodobně nepožadujete stránku, na které je několik set krát uvedeno slovo „psi“. Snažíme se zjistit, zda stránka obsahuje odpověď na váš dotaz, nebo jej pouze opakuje. Algoritmy Vyhledávání proto analyzují, zda stránky zahrnují relevantní obsah – například fotky nebo videa psů nebo dokonce seznamy plemen. Nakonec kontrolujeme, zda je stránka ve stejném jazyce jako dotaz, abychom upřednostnili stránky ve vašem preferovaném jazyce.

    Je důležité poznamenat, že ačkoli naše systémy vyhledávají tyto kvantifikovatelné faktory relevance, nejsou určeny k analýze subjektivních konceptů, jako je úhel pohledu nebo politický názor v obsahu stránky.

  • Vyhodnocení užitečnosti stránek

    Vyhodnocení užitečnosti stránek

    Pro typický dotaz jsou k dispozici tisíce nebo dokonce miliony webových stránek s potenciálně relevantními informacemi. Abychom mohli nejlepší stránky zobrazit jako první, vytváříme také algoritmy k posouzení užitečnosti jednotlivých webových stránek.

    Tyto algoritmy se snaží najít nejlepší informace, jaké jsou na internetu k dispozici. Analyzují při tom různé faktory, od aktuálnosti obsahu, přes počet výskytu hledaných výrazů až po uživatelský dojem ze stránky. Za účelem posouzení důvěryhodnosti a odbornosti hledáme weby, které pro podobné dotazy využívá mnoho uživatelů. Pokud na stránku odkazují jiné prominentní weby zabývající se daným tématem, je to signál, že stránka obsahuje kvalitní informace.

    Na internetu je mnoho spamových webů, které se na první místa ve výsledcích vyhledávání pokoušejí dostat pomocí technik, jako je opakování klíčových slov nebo nákup odkazů přenášejících hodnocení PageRank. Takové weby na uživatele dělají velmi špatný dojem a mohou uživatele Googlu dokonce poškodit nebo oklamat. Vytváříme proto algoritmy, které rozpoznávají spam a odstraňují z našich výsledků vyhledávání weby, jež porušují pokyny společnosti Google pro webmastery.

    Obsah internetu a širšího informačního ekosystému se neustále mění, proto průběžně analyzujeme a vyhodnocujeme kvalitu našich systémů, abychom dosáhli správného vyvážení relevance a směrodatnosti informací a udrželi si tak vaši důvěru ve výsledky, které vám přinášíme.

  • Vracení nejlepších výsledků

    Vracení nejlepších výsledků

    Před zobrazením výsledků vyhodnocujeme, jak do sebe všechny relevantní informace zapadají: zahrnují výsledky vyhledávání pouze jedno téma, nebo několik témat? Nezaměřuje se příliš mnoho stránek pouze na jednu velmi konkrétní interpretaci? Snažíme se poskytovat rozmanité informace ve formátech, které jsou pro konkrétní typ vyhledávání nejrelevantnější. S tím, jak se internet vyvíjí, rozvíjíme i naše systémy hodnocení, abychom dokázali nabízet lepší výsledky pro více dotazů.

    Tyto algoritmy analyzují signály, jako zda všichni uživatelé uvidí výsledek (např. jestli se web zobrazuje správně v různých prohlížečích), zda web podporuje všechny typy a velikosti zařízení, včetně počítačů, tabletů a chytrých telefonů, a zda se stránka načítá přiměřeně rychle i uživatelům s pomalým připojením k internetu.

    Jelikož vlastníci mohou použitelnost svých webů zlepšit, snažíme se je s předstihem informovat o důležitých změnách algoritmů Vyhledávání, na základě kterých mohou podnikat příslušné kroky. Např. v lednu 2018 jsme oznámili, že naše algoritmy začnou brát v potaz rychlost stránek na webech – šest měsíců před tím, než jsme tuto změnu skutečně zavedli. Na pomoc vlastníkům webů jsme poskytli podrobné pokyny a nástroje jako PageSpeed InsightsWebpagetest.org, pomocí nichž lze zjistit, jak (a zda vůbec) stránky lépe optimalizovat pro mobily.

    Další informace o nástrojích a tipech od Googlu pro vlastníky webů naleznete zde .

  • Zohlednění kontextu

    Zohlednění kontextu

    Informace, jako je vaše poloha, historie minulých vyhledávání a nastavení Vyhledávání, nám pomáhají přizpůsobit výsledky tomu, co je pro vás v danou chvíli nejužitečnější a nejrelevantnější.

    Na základě vaší země a polohy poskytujeme obsah relevantní pro vaši oblast. Pokud jste například v Chicagu a zadáte dotaz „fotbal“, Google vám nejspíš jako první zobrazí výsledky o americkém fotbalu a týmu Chicago Bears. Pokud ale výraz „fotbal“ vyhledáte v Londýně, upřednostní Google výsledky o evropském fotbalu a Premier League. Důležitým faktorem při rozhodování, které výsledky pro vás pravděpodobně budou užitečné, je také nastavení Vyhledávání, například preferovaný jazyk nebo přihlášení do Bezpečného vyhledávání (nástroj, který filtruje explicitní výsledky).

    V některých případech výsledky přizpůsobujeme také podle vaší nedávné aktivity ve Vyhledávání. Pokud například vyhledáte výraz „Barcelona“ a nedávno jste hledali „Barcelona vs. Arsenal“, pravděpodobně vás spíše než město zajímá fotbalový klub. Na stránce myaccount.google.com můžete vybrat, podle které aktivity vám máme Vyhledávání vylepšovat a které údaje máme ukládat do vašeho účtu Google.

    Vyhledávání také zahrnuje funkce, které personalizují výsledky na základě aktivity ve vašem účtu Google. Např. pokud vyhledáváte „události v okolí“, Google může vytvořit doporučení pro kategorie událostí, které by vás pravděpodobně mohly zajímat. Tyto systémy jsou vytvořeny tak, aby odpovídaly vašim zájmům, ale nedokážou odvodit citlivé kategorie, jako je vaše rasa, náboženské vyznání nebo politická příslušnost.

    Na stránce myaccount.google.com můžete vybrat, podle které aktivity vám máme Vyhledávání vylepšovat a které údaje máme ukládat do vašeho účtu Google. Chcete-li personalizaci Vyhledávání na základě aktivity v účtu deaktivovat, vypněte Aktivitu na webu a v aplikacích.