Hoe zoekalgoritmen werken

Gezien de grote hoeveelheid aan informatie op het web zou het vrijwel onmogelijk zijn om zonder hulp iets te zoeken. En dat is precies waar de rangschikkingssystemen van Google om de hoek komen kijken. In een fractie van een seconde doorzoeken ze honderden miljarden webpagina's in onze zoekindex om de meest relevante en bruikbare zoekresultaten te bieden. Vervolgens worden deze resultaten zo weergegeven dat je makkelijk vindt wat je zoekt.

Aan deze rangschikkingssystemen ligt een hele reeks algoritmen ten grondslag. Deze algoritmen kijken naar allerlei factoren om je de nuttigste informatie te tonen. Zo letten ze onder meer op hoe je de vraag formuleert, de relevantie en bruikbaarheid van pagina's, het expertiseniveau van bronnen en je locatie en instellingen. Hoe zwaar elke factor meeweegt, hangt af van de aard van je zoekopdracht. Meer recente informatie speelt bijvoorbeeld een grotere rol bij vragen over het laatste nieuws, terwijl dit bij vragen over definities in een woordenboek doorgaans niet relevant is.

Met een grondig proces van live tests en duizenden getrainde externe beoordelaars van zoekkwaliteit uit de hele wereld, zorgen we ervoor dat de algoritmen van Google Zoeken aan hoge normen voor relevantie en nut voldoen. Deze kwaliteitsbeoordelaars volgen strenge richtlijnen waarin onze doelen voor zoekalgoritmen zijn gedefinieerd en die iedereen kan lezen.

Hieronder vind je meer informatie over de belangrijkste factoren die bepalen welke resultaten voor je zoekopdracht worden gevonden.

  • Betekenis van je zoekopdracht

    Betekenis van je zoekopdracht

    Voor relevante resultaten moeten we eerst vaststellen welke informatie met je zoekopdracht zoekt: de intentie achter je zoekopdracht. Inzicht in intenties heeft te maken met het begrijpen van taal, wat een belangrijk aspect is van Google Zoeken. We ontwikkelen taalmodellen om te ontcijferen welke woordenreeksen we moeten opzoeken in de index.

    Dit bestaat uit eenvoudige stappen zoals het interpreteren van spelfouten, maar gaat zo ver als het toepassen van de nieuwste inzichten uit onderzoek naar het natuurlijke begrip van taal om inzicht te krijgen in het type zoekopdracht dat je invoert. Zo weet Google Zoeken via ons synoniemensysteem wat je bedoelt door vast te stellen dat verschillende woorden dezelfde betekenis hebben. Met deze functie kan Google Zoeken de zoekopdracht 'Hoe verwissel ik een lamp' koppelen aan pagina's die beschrijven hoe je een lamp moet vervangen. Dit systeem is vijf jaar lang in ontwikkeling geweest en heeft de resultaten voor meer dan 30% van de zoekopdrachten in verschillende talen verbeterd.

    Naast synoniemen proberen de algoritmen van Google Zoeken ook inzicht te krijgen in de informatiecategorie waarnaar je zoekt. Is het een zeer specifieke zoekopdracht of juist een hele brede? Komen er woorden als 'recensie', 'foto's' of 'openingstijden' in voor die aangeven dat er naar specifieke informatie wordt gezocht? Is de zoekopdracht geschreven in het Frans, wat suggereert dat je ook antwoorden wilt in die taal? Of zoek je naar een bedrijf in de buurt en wil je lokale informatie?

    Een belangrijk aspect van deze categoriebepaling van zoekopdrachten is onze analyse van de vraag of je zoekopdracht naar nieuwe content zoekt. Als je zoekt naar trending zoekwoorden, interpreteren onze actualiteitsalgoritmen dat als een signaal dat actuele informatie nuttiger kan zijn dan oudere pagina's. Dit betekent dat als je naar de meest recente 'voetbaluitslagen', naar de resultaten van 'Dancing with the stars' of naar de 'jaarrekening van Shell' zoekt, je de meest actuele informatie te zien krijgt.

  • Relevantie van webpagina's

    Relevantie van webpagina's

    Hierna analyseren algoritmen de content van webpagina's om te beoordelen of de pagina informatie bevat die relevant kan zijn voor datgene wat je zoekt.

    Het meest basale signaal dat informatie relevant is, is wanneer een webpagina hetzelfde zoekwoord bevat als je zoekopdracht. Als deze zoekwoorden op de pagina voorkomen of als ze voorkomen in de titel of hoofdtekst, is het waarschijnlijker dat de informatie relevant is. Naast deze eenvoudige zoekwoordovereenkomst maken we gebruik van verzamelde, geanonimiseerde interactiegegevens om te beoordelen of zoekresultaten relevant zijn voor een zoekopdracht. We zetten die gegevens om in signalen die onze machine learning-systemen helpen de relevantie beter in te schatten.

    Deze relevantiesignalen helpen de algoritmen van Google Zoeken te beoordelen of een webpagina een antwoord bevat op je zoekopdracht of slechts dezelfde vraag herhaalt. Wanneer je bijvoorbeeld naar 'honden' zoekt, wil je waarschijnlijk geen pagina zien waarop alleen honderden keren het woord 'honden' staat. Met dat in het achterhoofd beoordelen algoritmen of een pagina andere relevante content bevat naast het zoekwoord 'honden', zoals foto's van honden, video's of zelfs een lijst van hondenrassen.

    Hoewel onze systemen zoeken naar dit soort kwantificeerbare signalen om de relevantie te beoordelen, is het belangrijk om op te merken dat ze niet zijn ontworpen om subjectieve concepten te analyseren, zoals een standpunt of politieke gedachtegang van de content van een pagina.

  • De kwaliteit van content

    De kwaliteit van content

    De algoritmen van Zoeken matchen niet alleen je zoekopdracht met relevante documenten op internet, ze proberen ook de meest betrouwbare bronnen voorrang te geven. Daarom zijn onze systemen ontworpen om signalen te herkennen die kunnen bepalen welke pagina's over een bepaald onderwerp deskundig, gezaghebbend en betrouwbaar overkomen.

    We kijken naar sites die door veel gebruikers lijken te worden gewaardeerd voor vergelijkbare zoekopdrachten. Het blijkt bijvoorbeeld een goed teken van betrouwbare informatie te zijn als andere prominente websites naar die pagina linken (wat ook wel PageRank wordt genoemd). We gebruiken de verzamelde feedback uit ons evaluatieproces voor de kwaliteit van Zoeken om verder te verfijnen hoe onze systemen de kwaliteit van informatie beoordelen.

    Spamalgoritmen zijn belangrijk om vast te stellen of een pagina van lage kwaliteit is. Ook zorgen ze ervoor dat websites niet door middel van misleidend of manipulatief gedrag stijgen in de resultaten van Zoeken. In de Google-richtlijnen voor webmasters kun je bekijken welke technieken zulke spamwebsites van lage kwaliteit karakteriseren, zoals links kopen die voor PageRank zijn geslaagd of onzichtbare tekst op de pagina plaatsen.

    Zowel de content op internet als het steeds groter wordende ecosysteem van informatie blijven voortdurend veranderen. We meten en beoordelen daarom constant de kwaliteit van onze systemen, zodat we zeker weten dat we de juiste balans vinden tussen de relevantie en de gezaghebbendheid van informatie. Zo kun je blijven vertrouwen op de resultaten die je ziet.

  • Gebruiksgemak van webpagina's

    Gebruiksgemak van webpagina's

    Bij de rangschikking van resultaten beoordeelt Google Zoeken ook of webpagina's gemakkelijk te gebruiken zijn. Wanneer we aanhoudende pijnpunten voor gebruikers constateren, ontwikkelen we algoritmen om bruikbaardere pagina's te promoten ten opzichte van minder bruikbare, ervan uitgaande dat alle andere aspecten hetzelfde zijn.

    Deze algoritmen analyseren signalen die aangeven of al onze gebruikers het resultaat kunnen weergeven, bijvoorbeeld of de site correct wordt weergegeven in verschillende browsers; of de site ontworpen is voor alle typen apparaten van alle afmetingen zoals desktops, tablets en smartphones, en of de laadtijd voor de pagina goed werkt voor gebruikers met een trage internetverbinding.

    Aangezien website-eigenaren het gebruiksgemak van hun site kunnen verbeteren, werken we er hard aan om site-eigenaren van tevoren te informeren over significante wijzigingen in de algoritmen van Google Zoeken waarvoor ze actie kunnen ondernemen. Zo kondigden we bijvoorbeeld in januari 2018 aan dat onze algoritmen de 'paginasnelheid' zouden gaan meewegen, zes maanden voordat de wijziging werd doorgevoerd. We bieden website-eigenaren gedetailleerde richtlijnen en tools om hen te helpen, zoals PageSpeed Insights en Webpagetest.org, zodat site-eigenaren kunnen zien wat ze eventueel kunnen aanpassen om hun site geschikter te maken voor mobiele apparaten.

    Hier vind je meer informatie over de tools en tips die Google aan website-eigenaren biedt.

  • Context en instellingen

    Context en instellingen

    Op basis van informatie zoals je locatie, eerdere zoekgeschiedenis en zoekinstellingen kunnen we je resultaten aanpassen aan wat op dat moment het meest nuttig en relevant voor jou is.

    We gebruiken informatie over je land en locatie om content te bieden die relevant is voor je regio. Als je bijvoorbeeld in Chicago bent en naar 'football' zoekt, laat Google je waarschijnlijk eerst resultaten voor American football en de Chicago Bears zien. Zoek je in Londen naar 'football', dan plaatst Google de resultaten voor voetbal en de Premier League op een hogere positie. Instellingen voor zoeken zijn ook een belangrijke indicator voor de resultaten die je waarschijnlijk nuttig vindt. Zo kun je een voorkeurstaal instellen of je aanmelden voor SafeSearch (een tool waarmee expliciete resultaten worden weggefilterd).

    In sommige gevallen kunnen we je resultaten personaliseren aan de hand van informatie over je recente zoekactiviteit. Als je bijvoorbeeld naar 'Barcelona' zoekt en onlangs hebt gezocht naar 'Barcelona tegen Arsenal', kan dat een belangrijke aanwijzing zijn dat je op zoek bent naar informatie over de voetbalclub en niet over de stad.

    Google Zoeken omvat ook functies die resultaten personaliseren op basis van activiteit in je Google-account. Als je bijvoorbeeld zoekt naar 'evenementen bij mij in de buurt', kan Google enkele aanbevelingen voor evenementcategorieën op jou afstemmen omdat we denken dat je daarin geïnteresseerd bent. Deze systemen zijn zo ontworpen dat ze zoeken naar overeenkomsten met je interesses, maar ze zijn niet ontworpen om hieruit gevoelige kenmerken (zoals je ras, religie of politieke partij) af te leiden.

    Je kunt via myaccount.google.com bepalen welke zoekactiviteit wordt gebruikt om de functies van Google Zoeken voor jou te verbeteren. Zo kun je ook aangeven welke gegevens worden opgeslagen in je Google-account. Als je personalisatie van Google Zoeken op basis van activiteit in je account wilt uitschakelen, moet je Web- en app-activiteit uitschakelen.