A keresőalgoritmusok működése

Tekintettel az interneten rendelkezésre álló információ mennyiségére, a szükséges információ megtalálása a lehetetlennel lenne határos, ha nem akadna segítség a kereséshez. A Google rangsorolási rendszerei pontosan erre szolgálnak: a Kereső indexében megtalálható több száz milliárd weboldal átválogatására, hogy megtalálják a leginkább releváns, hasznos eredményeket a másodperc töredéke alatt, és olyan módon adják elő őket, hogy az segítsen Önnek a keresett információ megtalálásában.

E rangsorolási rendszereket nem egyetlen algoritmus alkotja, hanem algoritmusok egész sora. Hogy a leghasznosabb információkkal láthassák el Önt, a Kereső algoritmusai számos tényezőt figyelembe vesznek, így például a lekérdezés szavait, az oldalak relevanciáját és hasznosságát, a források szakmaiságát, továbbá az Ön tartózkodási helyét és a beállításait. Az egyes tényezőknél alkalmazott súlyozás a lekérdezés jellegétől függően változik: például a tartalom frissessége nagyobb szerepet játszik az aktuális hírek témáira vonatkozó lekérdezéseknél, mint a szótári definíciókra vonatkozóknál.

Annak biztosítása érdekében, hogy a Kereső algoritmusai megfeleljenek a relevanciával és a minőséggel kapcsolatos szigorú követelményeknek, az élő teszteket és a világszerte tevékenykedő több ezer képzett keresésminőségi értékelőt egyaránt magukban foglaló szigorú folyamataink vannak. A minőségértékelők szigorú, a Keresés algoritmusaival kapcsolatos céljainkat meghatározó és bárki számára nyilvánosan megtekinthető irányelveket követnek.

Tudjon meg többet azokról a tényezőkről, amelyek segítenek meghatározni, hogy milyen eredményeket jelenítsünk meg az Ön kérdéseire:

  • A szavak elemzése

    A keresett szavak elemzése

    A releváns találatok megjelenítéséhez elengedhetetlen, hogy megértsük a keresett szavak értelmét - a keresés szándékát. A szándék megértése alapvetően nyelvi megértésre épül, ami ezért a Kereső alapvető és kritikus összetevője. Nyelvi modelleket építünk, amelyek megpróbálják megfejteni, milyen szavakat vagy szavak kombinációját keressük az indexünkben.

    Ez az elütések értelmezésének viszonylag egyszerűnek tűnő módszerétől kezdve a begépelt lekérdezés típusának felismeréséig sok mindent magában foglal, s utóbbihoz a természetes nyelvfelismerés legfrissebb tudományos eredményeit is felhasználjuk. A szinonimarendszerünk például azáltal segíti a Keresőt, hogy megmutatja, ahogy különböző szavaknak ugyanaz lehet a jelentése. Ennek a komponensnek a fejlesztése több mint öt éven át tartott, és a keresések több mint 30%-ában hozott jelentős fejlődést, az éppen használt nyelvtől függetlenül.

    Igyekszünk azt is megérteni, hogy Ön milyen kategóriájú információt keres. Vajon nagyon pontosan meghatározott keresésről van szó, vagy inkább tágabb értelmű a lekérdezés? Szerepelnek benne olyan kifejezések, mint az „értékelés”, „képek” vagy „nyitvatartási idő”, amelyek valamilyen konkrét információigényre utalnak? Olyan felkapott kulcsszavakra keres, amelyek azt sugallják, hogy az adott napon megjelent tartalmakra kíváncsi? Vagy esetleg valamilyen közeli vállalkozás a keresés tárgya, és helyi érdekű információkat szeretne megkapni?

    A keresések kategorizálásának további fontos szempontja, hogy vajon friss tartalmak megtalálására irányulnak-e. A népszerű kulcsszavakat a frissességi algoritmusaink arra utaló jelként értelmezik, hogy a régebbi oldalaknál valószínűleg relevánsabb találatokat jelentenek a naprakész információk. Így érkezik aktuális információ például az „NFL pontszámok”, az „X-Faktor” vagy a „Richter bevétele” keresésre.

  • A releváns weboldalak azonosítása

    A releváns weboldalak azonosítása

    A következő lépésben olyan weboldalakat keresünk, amelyek a lekérdezéshez kapcsolódó információkat tartalmaznak. Amikor Ön rákeres valamilyen kifejezésre, akkor az algoritmusaink tulajdonképpen megkeresik az adott kifejezéseket az indexben, hogy megtalálják a megfelelő weboldalakat. Ezek az algoritmusok kielemzik, hogy a kulcsszavak milyen gyakran és hol jelennek meg a weboldalon: a címben vagy fejlécekben, esetleg magában a szövegtestben.

    A relevancia legalapvetőbb jele, hogy a weboldalon is megtalálhatók a kereséshez használt kulcsszavak. Ha a kulcsszavak szerepelnek a szóban forgó oldalon (a fejlécben vagy a szövegtörzsben), akkor az oldal nagyobb valószínűséggel jelent releváns találatot. A relevancia felméréséhez az egyszerű kulcsszókeresésen túl összesített és anonimizált interakciós adatokat is felhasználunk. Ezeket az adatokat olyan jelekké alakítjuk, amelyekkel a gépi tanuláson alapuló rendszereink jobban megbecsülhetik az oldalak relevanciáját.

    Az algoritmusok nem csak egyező kulcsszavakat keresnek, hanem olyan jeleket is, amelyekkel megmérhetik, mennyire hasznos válaszokat adhatnak a potenciális keresési találatok. Ha Ön például a „kutyák” kifejezésre keres, feltehetőleg nem olyan weboldalra kíváncsi, ahol a „kutyák” kifejezés százszor is szerepel. Azt próbáljuk kitalálni, hogy a weboldal tartalmaz-e választ a lekérdezésre, és nem csak ismételgeti-e a keresett kifejezést. A keresőalgoritmusok tehát azt elemzik, hogy releváns tartalom szerepel-e az oldalakon – például kutyákat ábrázoló képek, videók, vagy akár listák a különböző kutyafajtákról. Végül pedig ellenőrizzük, hogy az oldal ugyanazon a nyelven íródott-e, mint a feltett kérdés, így az Ön által preferált nyelv szerint rangsoroljuk.

    Fontos megjegyezni, hogy habár a rendszereink számos számszerűsíthető jel alapján értékelik a relevanciát, nem úgy terveztük őket, hogy szubjektív jellemzőket (például nézőpontokat vagy politikai beállítottságot) is azonosítsanak az oldalakon.

  • Hasznos oldalak rangsorolása

    Hasznos oldalak rangsorolása

    Egy átlagos lekérdezésre weboldalak ezrei, sőt, milliói tartalmazhatnak releváns választ. Így azért, hogy a legjobb oldalak kerüljenek legelőre, olyan algoritmusokat is írunk, amelyek kiértékelik a weboldalak hasznosságát.

    Ezek az algoritmusok száz és száz különböző tényezőt elemeznek, hogy megtalálják az internet által kínált információk közül a leghasznosabbakat. Ilyen tényező például a tartalom frissessége, az, hogy hányszor jelent meg a keresett kifejezés, illetve milyen minőségű felhasználói élményt biztosít az adott oldal. A témával kapcsolatos megbízhatóság és hozzáértés kiértékelése során olyan webhelyeket keresünk, amelyeket úgy tűnik, hogy hasznosnak találnak a felhasználók hasonló lekérdezéseknél. Ha a témában más jelentős webhely is hivatkozik az adott weboldalra, akkor azt a minőségi információ jelének vehetjük.

    Rengeteg spam jellegű webhely létezik, amelyek különböző ravasz technikák révén próbálnak a találati lista elejére kerülni: például kulcsszavakat ismételgetnek, vagy PageRank-mutatót befolyásoló linkeket vásárolnak meg. Ezek a webhelyek nagyon rossz felhasználói élményt nyújtanak, sőt, többük akár ártalmas is lehet, vagy félrevezetheti a Google felhasználóit. Emiatt olyan algoritmusokat írunk, amelyek beazonosítják és eltávolítják azokat a spam jellegű webhelyeket a találatok közül, amelyek megsértik a Google webmesteri irányelveit.

    Az interneten található tartalmak és a tágabb információs ökoszisztéma állandóan változik, ezért folyamatosan mérjük és értékeljük a rendszereink teljesítményét. Így egyensúlyba kerülhet az információk relevanciája és szakmaisága, amellyel biztosíthatjuk a megjelenő találatok megbízhatóságát.

  • A legjobb találatok megjelenítése

    A legjobb találatok megjelenítése

    A találatok megjelenítése előtt mérlegeljük, hogyan illeszkedik egymáshoz az összes releváns információ: minden egy téma köré csoportosul a keresési találatok között, vagy több témáról is szó lehet? Nem szól túl sok weboldal ugyanarról az egyetlen szűk értelmezési lehetőségről? Arra törekszünk, hogy változatos információkat biztosítsunk olyan formátumokban, amelyek a keresés szempontjából a leghasznosabbak. Ahogyan az internet fejlődik, úgy fejlesztjük mi is rangsoroló rendszereinket, hogy még több lekérdezéshez jeleníthessünk meg még jobb találatokat.

    Az algoritmusok többek között olyan jeleket keresnek, amelyek arról árulkodnak, hogy a találat minden felhasználó számára megtekinthető, például ha a webhely helyesen jelenik meg minden böngészőben; ha minden eszköztípusra és -méretre felkészítették, így az asztali számítógépekre, a táblagépekre és az okostelefonokra is; továbbá ha az oldalak a lassú kapcsolaton csatlakozó felhasználók számára is gyorsan betöltődnek.

    A webhelyek használhatósága a tulajdonosukon múlik, ezért mindent megteszünk, hogy előre értesítsük őket a Keresés algoritmusait érintő olyan jelentős változásokról, amelyek tudatában feltehetőleg meg kell fontolniuk webhelyük módosítását. 2018 januárjában például bejelentettük, hogy algoritmusaink hat hónap múlva a webhelyeken található oldalak gyorsaságát is figyelembe veszik majd. A tulajdonosokat részletes útmutatókkal, valamint olyan eszközökkel is segítettük, mint a PageSpeed Insights és a Webpagetest.org, hogy azonosíthassák azokat az oldalakat, amelyek változtatást igényelnek a mobilbarát jelleg kialakítása érdekében.

    Ezen a linken további információk találhatók a Google webhelytulajdonosoknak nyújtott eszközeiről és tanácsairól.

  • Kontextus és beállítások

    A kontextus mérlegelése

    Az olyan információk, mint az Ön tartózkodási helye, keresési előzményei és keresési beállításai mind-mind a segítségünkre vannak abban, hogy valóban az adott pillanatban hasznos és releváns találatokat jelenítsünk meg.

    Tartózkodási helyét és országát arra használjuk, hogy az adott területre vonatkozó tartalmakat jelenítsünk meg Önnek. Tegyük fel, hogy Ön Chicagóban van és a „futball” kifejezésre keres. Ebben az esetben a Google valószínűleg az amerikai futballhoz és a Chicago Bears csapathoz kapcsolódó találatokat mutatja előbb. Ugyanakkor ha London utcáin sétálva keresne ugyanerre, akkor a Google a labdarúgás és a Premier League találatait helyezi előrébb a találatok között. A Keresés beállításai szintén fontos mutatói annak, hogy milyen találatok számíthatnak hasznosnak: például a preferált nyelvi beállítás, illetve hogy Ön engedélyezte-e a Biztonságos Keresést, amely kiszűri a szókimondó tartalmakat.

    Bizonyos esetekben előfordul, hogy személyre szabjuk a találatokat a legutóbbi keresési tevékenység adatai alapján. Például ha Ön a „Barcelona” szót írja be a keresőbe, de közben azt is tudjuk, hogy nemrég a „Barcelona vs Arsenal” kifejezésre keresett, akkor ez árulkodhat arról, hogy Önt a focicsapat érdekli, nem pedig a város. A myaccount.google.com oldalon Ön megszabhatja, hogy milyen keresési tevékenységek legyenek használhatóak a keresési élmény javításához, például beállíthatja azt is, hogy mely adatok kerüljenek mentésre a Google-fiókjában.

    A Kereső olyan funkciókat is tartalmaz, amelyek a Google-fiókjában végzett tevékenységek alapján szabják személyre a találatokat. Ha például a „közeli események” kifejezésre keres, a Google olyan javaslatokat választhat, amelyek megfelelnek az Ön érdeklődési köreinek. A rendszereink arra fejlesztettük ki, hogy igazodjanak a felhasználók érdeklődési köreihez, de arra nem, hogy olyan személyes jellemzőket következtessenek ki, mint például az etnikai hovatartozás, a vallási vagy politikai nézetek.

    A myaccount.google.com oldalon megszabhatja, hogy milyen keresési tevékenységek legyenek használhatóak a Kereső működése során (például beállíthatja azt is, hogy mely adatok kerüljenek mentésre a Google-fiókjában). A Kereső tevékenységalapú személyre szabását az Internetes és alkalmazástevékenységek (Web & App Activity) funkció kikapcsolásával tilthatja le.