Miten Haun algoritmit toimivat

Verkossa on niin paljon tietoa, että tarvittavan tiedon löytäminen olisi lähes mahdotonta ilman järjestelyapua. Googlen sijoitusjärjestelmät on suunniteltu juuri tätä varten: ne käyvät läpi miljardeja Haun hakemistossa olevia verkkosivuja ja löytävät osuvimmat ja hyödyllisimmät tulokset sekunnin murto-osassa sekä näyttävät ne tavalla, joka auttaa löytämään etsimäsi.

Nämä sijoitusjärjestelmät koostuvat algoritmien sarjasta. Jotta voimme tarjota sinulle mahdollisimman hyödyllistä tietoa, Haun algoritmit kiinnittävät huomiota useisiin tekijöihin, kuten haussa käyttämiisi sanoihin, sivujen osuvuuteen ja käytettävyyteen, lähteiden asiantuntemukseen sekä sijaintiisi ja asetuksiisi. Kunkin tekijän painoarvo vaihtelee hakusi tyypin mukaan – esimerkiksi sisällön tuoreus on tärkeämpi tekijä ajankohtaisten uutisaiheiden kohdalla kuin sanakirjamääritelmien kohdalla.

Käytössämme on perusteellinen prosessi, jolla pyrimme varmistamaan, että Haun algoritmit vastaavat osuvuudelle ja laadulle asetettuja vaatimuksia. Prosessiin kuuluu sekä live-testejä että tuhansia ulkoisia koulutettuja Haun laadun arvioijia ympäri maailman. Laadun arvioijat seuraavat tarkkoja, julkisesti nähtävillä olevia ohjeita, joissa on määritetty tavoitteemme Haun algoritmeille.

Lue alta lisää tärkeimmistä tekijöistä, jotka auttavat määrittämään, millaisia tuloksia näet vastauksena hakuusi.

  • Sanojen analysointi

    Sanojen analysointi

    Meille on tärkeää ymmärtää hakusi tarkoitus voidaksemme tarjota sinulle hyviä vastauksia. Löytääksemme sivuja, joissa on hakusi kannalta olennaista tietoa, analysoimme mitä hakukyselyssäsi olevat sanat tarkoittavat. Rakennamme kielellisiä malleja selvittääksemme, mitä sanoja meidän pitäisi löytää hakemistosta.

    Tämä sisältää näennäisen yksinkertaisia toimia, esimerkiksi kirjoitusvirheiden tunnistamista. Toisaalta sovellamme viimeisimpiä kielen tulkitsemisen tutkimustuloksia ymmärtääksemme kyselyitä. Esimerkiksi synonyymien käsittely auttaa hakujärjestelmää ymmärtämään tarkoituksesi, jos sanalle on useita määritelmiä. Järjestelmän kehittäminen kesti yli viisi vuotta, ja se parantaa eri kielillä tehtyjen hakujen tuloksia yli 30 %:ssa tapauksista.

    Yritämme tulkita, minkätyyppistä tietoa etsit. Onko hakusi tarkkaan rajattu vai laaja? Onko siinä sanoja, jotka kuvaavat haun kohteena olevaa tietotyyppiä, esimerkiksi "arvostelu", "kuvat" tai "aukioloajat"? Etsitkö sillä hetkellä suosittuja avainsanoja, jolloin haluat ehkä asiaan liittyvät viimeisimmät julkaisut, vai lähellä olevaa yritystä, jolloin haluat paikallisia tietoja?

    Tässä kyselyluokituksessa erityisen tärkeä tekijä on se, etsiikö kysely tuoretta sisältöä. Jos haet trendaavia avainsanoja, tuoreusalgoritmimme tulkitsevat tämän merkiksi siitä, että ajantasaisista tiedoista on enemmän hyötyä kuin vanhoista sivuista. Jos siis haet uusimpia SM-liigan tuloksia, Tanssii tähtien kanssa ‑tuloksia tai Exxonin liikevoittoa, näet viimeisimmät tiedot.

  • Vastaavuuksien löytäminen

    Vastaavuuksien löytäminen

    Seuraavaksi etsimme verkkosivuja, joiden sisältö vastaa kyselyäsi. Kun teet haun, algoritmimme aloittavat sen käsittelyn vertaamalla hakutermejä niitä mahdollisesti vastaaviin hakemiston sivuihin. Ne analysoivat avainsanojen esiintymistiheyttä ja ‑paikkoja ‎sivulla ja sitä, ovatko ne sivun otsikoissa vai leipätekstissä.

    Selkein merkki tietojen osuvuudesta on hakukyselyn avainsanojen esiintyminen verkkosivulla. Jos kyselyn avainsanat näkyvät sivulla, otsikoissa tai leipätekstissä, tiedot ovat todennäköisemmin osuvia. Avainsananosumien lisäksi käytämme koottua ja anonymisoitua interaktiodataa, jonka avulla arvioidaan hakutulosten osuvuus kyselyihin nähden. Muunnamme tämän datan signaaleiksi, jotka auttavat koneoppivia järjestelmiämme arvioimaan osuvuutta paremmin.

    Avainsanojen vastaavuuksien lisäksi algoritmit etsivät merkkejä siitä, miten hyvin mahdolliset hakutulokset vastaavat käyttäjän tarpeisiin. Jos haet esimerkiksi koiria, et välttämättä halua sivua, jolla toistetaan satoja kertoja sana "koirat". Yritämme selvittää, vastaako sivu kyselyysi vai toistaako se vain kyselyn. Tätä varten algoritmimme selvittävät, onko sivulla asianmukaista sisältöä, kuten koirien kuvia, videoita tai luettelo roduista. Lopuksi katsomme, onko sivu kirjoitettu kyselysi kielellä, jotta kielelläsi kirjoitetut tulokset voidaan nostaa etusijalle tuloksissa.

    On tärkeää muistaa, että vaikka järjestelmämme arvioivat osuvuutta etsimällä tällaisia mitattavia signaaleja, niitä ei ole suunniteltu analysoimaan subjektiivisia käsitteitä, kuten sivun sisällön näkökulmaa tai poliittista suuntautumista.

  • Sivujen asettaminen hyödyllisyysjärjestykseen

    Sivujen asettaminen hyödyllisyysjärjestykseen

    Yhtä hakua kohti saattaa löytyä tuhansia, jopa miljoonia verkkosivuja, joilla voi olla hakijalle olennaista tietoa. Jotta parhaat sivut voidaan näyttää listan kärjessä, algoritmimme arvioivat verkkosivujen hyödyllisyyttä.

    Algoritmit ottavat huomioon satoja tekijöitä arvioidessaan, mikä on parasta mahdollista näytettävää tietoa. Tekijöitä ovat esimerkiksi sisällön tuoreus, hakutermien esiintymien määrä ja sivun käyttökokemuksen laatu. Arvioimme sivun luotettavuutta ja aihetuntemusta tutkimalla sivustoja, joihin monet käyttäjät luottavat samanlaisten kyselyjen yhteydessä. Jos muut tärkeät sivustot linkittävät sivulle, sen sisältö on todennäköisemmin laadukasta.

    Verkossa on monia roskasivustoja, jotka pyrkivät hakutulosten kärkeen esimerkiksi avainsanojen jatkuvalla toistamisella tai PageRankia siirtäviä linkkejä ostamalla. Näiden sivustojen käyttökokemus voi olla heikko ja ne voivat jopa vahingoittaa Googlen käyttäjiä tai johtaa heitä harhaan. Siksi kehitimme algoritmeja, jotka tunnistavat roskasisällön ja poistavat tuloksista Googlen verkkovastaavan ohjeiden vastaiset tulokset.

    Verkossa oleva sisältö ja laajempi tietoekosysteemi muuttuvat lakkaamatta. Mittaamme ja arvioimme järjestelmiemme laatua jatkuvasti varmistaaksemme sopivan tasapainon tietojen osuvuudelle ja luotettavuudelle, jotta voit luottaa näkemiisi tuloksiin.

  • Parhaiden tulosten näyttäminen

    Parhaiden tulosten näyttäminen

    Ennen hakutulosten näyttämistä Google Haku arvioi, ovatko valitut verkkosivut helppokäyttöisiä. Kun havaitsemme, että käyttäjillä on ongelmia jollakin sivulla, helppokäyttöisempien sivujen sijoitusta nostetaan hakutuloksissa. Pyrimme aina antamaan monipuolisen valikoiman tietoa siinä muodossa, joka on kyselysi kannalta hyödyllisintä.

    Algoritmit analysoivat signaaleja, jotka kertovat, näkyykö tulos kaikille käyttäjille. Tällöin tarkistetaan, näkyykö sivusto oikein eri selaimissa, onko se suunniteltu kaikentyyppisille ja ‑kokoisille laitteille (mukaan lukien tietokoneet, tabletit ja älypuhelimet) ja sopivatko sivujen latausajat käyttäjille, joilla on hidas internetyhteys.

    Verkkosivuston omistaja voi itse parantaa sivustonsa käytettävyyttä, joten pyrimme parhaamme mukaan ilmoittamaan sivustojen omistajille etukäteen merkittävistä, toimenpiteitä vaativista muutoksista Haun algoritmeihin. Esimerkiksi tammikuussa 2018 ilmoitimme, että algoritmimme ottavat jatkossa huomioon sivustojen latausnopeuden. Ilmoitus lähetettiin kuusi kuukautta ennen muutoksen käyttöönottoa. Tarjoamme sivustojen omistajille yksityiskohtaisia ohjeita ja työkaluja (esim. PageSpeed Insights ja Webpagetest.org) näyttääksemme, miten he voisivat mahdollisesti parantaa sivuston mobiiliystävällisyyttä.

    Täällä on lisätietoja työkaluista ja vinkeistä, joita Google tarjoaa sivustojen omistajille.

  • Kontekstin huomioiminen

    Kontekstin huomioiminen

    Sinulle valitaan hakuhetkellä hyödyllisimpiä ja osuvimpia tuloksia esimerkiksi sijainnin, hakuhistorian ja hakuasetuksien perusteella.

    Näytämme sinulle alueesi kannalta osuvaa tietoa maa- ja sijaintitietojen avulla. Jos esimerkiksi haet jalkapalloa ja olet Chicagossa, Google näyttää todennäköisesti sinulle aluksi tuloksia amerikkalaisesta jalkapallosta ja Chicago Bears ‑joukkueesta. Jos taas haet jalkapalloa Lontoossa, Google sijoittaa jalkapallo- ja Valioliiga-tuloksia korkeammalle. Hakuasetuksistasi voidaan myös päätellä, mitä tuloksia pidät hyödyllisinä: siellä voit valita kielen tai ottaa käyttöön SafeSearch-työkalun, joka auttaa suodattamaan pois sopimattomia tai seksuaalisia tuloksia.

    Joskus käytämme tietoja aiemmista hauistasi myös tulosten personointiin. Jos esimerkiksi haet sanaa Barcelona ja olet äskettäin tehnyt haun Barcelona vastaan Arsenal, päättelemme, että sinua kiinnostaa jalkapallojoukkue kaupungin sijaan. Osoitteessa myaccount.google.com voit hallita hakukokemuksen optimointiin käytettäviä tietoja ja Google-tilillesi tallennettavia tietoja.

    Haussa on myös ominaisuuksia, jotka personoivat tuloksia Google-tilillä olevan toiminnan perusteella. Jos esimerkiksi haet lähistöllä olevia tapahtumia, Google voi räätälöidä suosituksia sellaisten tapahtumaluokkien perusteella, joiden uskomme kiinnostavan sinua. Nämä järjestelmät on suunniteltu huomioimaan kiinnostuksen kohteesi, mutta niiden ei ole tarkoitus päätellä arkaluontoisia seikkoja, kuten etnistä taustaa, uskontoa tai poliittista puoluetta.

    Osoitteessa myaccount.google.com voit hallita hakukokemuksen optimointiin käytettäviä tietoja ja Google-tilillesi tallennettavaa dataa. Jos haluat lopettaa Haun tilitoimintaan perustuvan personoinnin, poista Verkko- ja sovellustoiminta käytöstä.