Πώς λειτουργούν οι αλγόριθμοι της Αναζήτησης

Με τον όγκο των πληροφοριών που είναι διαθέσιμες στον ιστό, θα ήταν σχεδόν αδύνατο να βρείτε αυτό που ψάχνετε χωρίς κάποια βοήθεια στην ταξινόμηση των πληροφοριών. Τα συστήματα κατάταξης της Google έχουν σχεδιαστεί ακριβώς για αυτόν τον σκοπό, δηλαδή για να ταξινομούν τις εκατοντάδες δισεκατομμύρια ιστοσελίδες στο ευρετήριο Αναζήτησης, προκειμένου να εντοπίζουν τα πιο σχετικά και χρήσιμα αποτελέσματα σε κλάσματα δευτερολέπτου και να τα παρουσιάζουν με τρόπο που σας βοηθάει να βρείτε αυτό που αναζητάτε.

Αυτά τα συστήματα ταξινόμησης δεν αποτελούνται από έναν αλγόριθμο, αλλά από ολόκληρες σειρές αλγορίθμων. Προκειμένου να λαμβάνετε τις πιο χρήσιμες πληροφορίες, οι αλγόριθμοι Αναζήτησης εξετάζουν πολλούς παράγοντες, συμπεριλαμβανομένων των λέξεων του ερωτήματός σας, της σχετικότητας και της χρησιμότητας των σελίδων, της εξειδίκευσης των πηγών, καθώς και της τοποθεσίας και των ρυθμίσεών σας. Η βαρύτητα που εφαρμόζεται σε κάθε παράγοντα ποικίλει ανάλογα με τη φύση του ερωτήματός σας. Για παράδειγμα, το πόσο πρόσφατο είναι το περιεχόμενο παίζει μεγαλύτερο ρόλο στην απάντηση ερωτημάτων σχετικά με τρέχοντα θέματα ειδήσεων από ό,τι σε σχέση με ορισμούς λεξικού.

Προκειμένου να διασφαλίσουμε ότι οι αλγόριθμοι Αναζήτησης ικανοποιούν υψηλά πρότυπα συνάφειας και ποιότητας, ακολουθούμε μια αυστηρή διαδικασία η οποία περιλαμβάνει τόσο ζωντανές δοκιμές όσο και χιλιάδες εκπαιδευμένους εξωτερικούς ελεγκτές ποιότητας της Αναζήτησης από όλο τον κόσμο. Αυτοί οι ελεγκτές ποιότητας ακολουθούν αυστηρές οδηγίες οι οποίες προσδιορίζουν τους στόχους μας για τους αλγορίθμους Αναζήτησης και διατίθενται δημόσια για να μπορούν να τους δουν όλοι οι χρήστες.

Μάθετε περισσότερα παρακάτω σχετικά με τους σημαντικούς παράγοντες που συμβάλλουν στον καθορισμό των αποτελεσμάτων που εμφανίζονται για το ερώτημά σας:

  • Ανάλυση των λέξεών σας

    Ανάλυση των λέξεών σας

    Η κατανόηση της σημασίας της αναζήτησής σας είναι εξαιρετικά σημαντική για την εμφάνιση καλών απαντήσεων. Επομένως, για την εύρεση σελίδων με συναφείς πληροφορίες, το πρώτο βήμα είναι να αναλύσουμε το νόημα των λέξεων που χρησιμοποιήσατε στο ερώτημα αναζήτησης. Δημιουργούμε γλωσσικά μοντέλα σε μια προσπάθεια να αποκρυπτογραφήσουμε τις συμβολοσειρές λέξεων που πρέπει να αναζητήσουμε στο ευρετήριο.

    Αυτό περιλαμβάνει τα βήματα που είναι φαινομενικά απλά όπως η ερμηνεία ορθογραφικών λαθών και επεκτείνεται στην προσπάθεια κατανόησης του τύπου ερωτήματος που έχετε πληκτρολογήσει εφαρμόζοντας μερικές από τις πιο πρόσφατες έρευνες σχετικά με την κατανόηση της φυσικής γλώσσας. Για παράδειγμα, το σύστημα συνωνύμων που διαθέτουμε βοηθά την Αναζήτηση να γνωρίζει τι εννοείτε, ακόμα και αν μια λέξη έχει πολλαπλούς ορισμούς. Αυτό το σύστημα χρειάστηκε πάνω από πέντε χρόνια για να αναπτυχθεί και βελτιώνει σημαντικά τα αποτελέσματα σε πάνω από 30% των αναζητήσεων σε όλες τις γλώσσες.

    Προσπαθούμε επίσης να κατανοήσουμε ποια κατηγορία πληροφοριών αναζητάτε. Πρόκειται για μια πολύ συγκεκριμένη αναζήτηση ή ένα ευρύ ερώτημα; Υπάρχουν λέξεις όπως "αξιολόγηση" ή "εικόνες" ή "ώρες λειτουργίας" που υποδηλώνουν μια συγκεκριμένη ανάγκη πληροφόρησης πίσω από την αναζήτηση; Αναζητάτε χρησιμοποιώντας ανερχόμενες λέξεις-κλειδιά που υπονοούν ότι θέλετε περιεχόμενο που δημοσιεύτηκε εκείνη την ημέρα; Ή μήπως αναζητάτε μια κοντινή επιχείρηση και θέλετε τοπικές πληροφορίες;

    Μια ιδιαίτερα σημαντική διάσταση αυτής της κατηγοριοποίησης ερωτημάτων είναι η ανάλυση του κατά πόσο το ερώτημά σας αναζητά νέο περιεχόμενο. Εάν αναζητάτε ανερχόμενες λέξεις-κλειδιά, οι αλγόριθμοι ανανέωσης θα ερμηνεύσουν αυτήν την ενέργεια ως ένδειξη ότι οι ενημερωμένες πληροφορίες μπορεί να είναι πιο χρήσιμες από αυτές σε παλαιότερες σελίδες. Αυτό σημαίνει ότι όταν αναζητάτε τα πιο πρόσφατα "σκορ του NFL", τα αποτελέσματα του "dancing with the stars" ή τα "κέρδη της exxon", θα βλέπετε τις πιο πρόσφατες πληροφορίες.

  • Αντιστοίχιση της αναζήτησής σας

    Αντιστοίχιση της αναζήτησής σας

    Στη συνέχεια, αναζητούμε ιστοσελίδες με πληροφορίες που αντιστοιχούν στο ερώτημά σας. Όταν κάνετε μια αναζήτηση, στο πιο βασικό επίπεδο, οι αλγόριθμοί μας αναζητούν τους όρους αναζήτησης στο ευρετήριο για να βρουν τις κατάλληλες σελίδες. Αναλύουν πόσο συχνά και πού εμφανίζονται αυτές οι λέξεις-κλειδιά σε μια σελίδα, είτε σε τίτλους είτε σε επικεφαλίδες ή στο σώμα του κειμένου.

    Η πιο βασική ένδειξη για τη συνάφεια των πληροφοριών είναι όταν μια ιστοσελίδα περιέχει τις ίδιες λέξεις-κλειδιά με το ερώτημα αναζήτησης. Αν αυτές οι λέξεις-κλειδιά εμφανίζονται στη σελίδα ή αν εμφανίζονται στις επικεφαλίδες ή το κύριο τμήμα του κειμένου, οι πληροφορίες είναι πιο πιθανό να είναι σχετικές. Εκτός από την απλή αντιστοίχιση λέξεων-κλειδιών, χρησιμοποιούμε συγκεντρωτικά και ανώνυμα δεδομένα αλληλεπίδρασης, για να εκτιμήσουμε το αν τα αποτελέσματα αναζήτησης σχετίζονται με τα ερωτήματα. Μετατρέπουμε αυτά τα δεδομένα σε ενδείξεις που βοηθούν τα συστήματα μηχανικής εκμάθησης να εκτιμούν καλύτερα τη συνάφεια.

    Επιπλέον της αντιστοίχισης λέξεων-κλειδιών, οι αλγόριθμοι αναζητούν ενδείξεις για να μετρήσουν τον βαθμό στον οποίο διάφορα δυνητικά αποτελέσματα αναζήτησης προσφέρουν στους χρήστες αυτό που αναζητούν. Όταν ψάχνετε για τον όρο "σκύλοι" πιθανότατα δεν θέλετε μια σελίδα με τη λέξη "σκύλοι" να εμφανίζεται εκατοντάδες φορές. Προσπαθούμε να καταλάβουμε αν η σελίδα περιέχει μια απάντηση στο ερώτημά σας και δεν επαναλαμβάνει απλώς το ερώτημά σας. Έτσι, οι αλγόριθμοι της Αναζήτησης αναλύουν αν οι σελίδες περιέχουν σχετικό περιεχόμενο, όπως φωτογραφίες σκύλων, βίντεο ή ακόμα και μια λίστα με ράτσες. Τέλος, ελέγχουμε αν η σελίδα είναι γραμμένη στην ίδια γλώσσα με την ερώτησή σας, προκειμένου να δοθεί προτεραιότητα στις σελίδες στην προτιμώμενη γλώσσα σας.

    Είναι πολύ σημαντικό να έχετε υπόψη σας ότι, παρά το ότι τα συστήματά μας αναζητούν αυτού του είδους τις ποσοτικές ενδείξεις για την εκτίμηση της συνάφειας, δεν έχουν σχεδιαστεί, για να αναλύουν υποκειμενικές έννοιες, όπως είναι η άποψη ή η πολιτική θέση του περιεχομένου μιας σελίδας.

  • Κατάταξη χρήσιμων σελίδων

    Κατάταξη χρήσιμων σελίδων

    Για ένα τυπικό ερώτημα, υπάρχουν χιλιάδες, ακόμη και εκατομμύρια, ιστοσελίδες με πιθανές συναφείς πληροφορίες. Επομένως, για να κατατάξουμε πρώτες τις καλύτερες σελίδες, συντάσσουμε επίσης αλγορίθμους που αξιολογούν πόσο χρήσιμες είναι αυτές οι ιστοσελίδες.

    Αυτοί οι αλγόριθμοι αναλύουν εκατοντάδες διαφορετικούς παράγοντες για να προσπαθήσουν να εντοπίσουν τις καλύτερες πληροφορίες που προσφέρει ο ιστός, από την κατάσταση ενημέρωσης του περιεχομένου έως τον αριθμό εμφάνισης των όρων αναζήτησης και εάν η σελίδα παρέχει καλή εμπειρία χρήστη. Προκειμένου να εκτιμηθεί η αξιοπιστία και η εγκυρότητα σχετικά με το αντικείμενό τους, αναζητούμε ιστοτόπους που φαίνεται να προτιμούν πολλοί χρήστες για παρόμοια ερωτήματα. Αν άλλοι γνωστοί ιστότοποι με το συγκεκριμένο αντικείμενο παραπέμπουν με συνδέσμους στη σελίδα, αυτό είναι ένα καλό σημάδι ότι οι πληροφορίες είναι υψηλής ποιότητας.

    Υπάρχουν πολλοί ιστότοποι ανεπιθύμητου περιεχομένου στον ιστό που επιχειρούν να ανελιχθούν στην κορυφή των αποτελεσμάτων αναζήτησης με χειρισμούς τύπου gaming μέσω τεχνικών όπως επαναλαμβάνοντας συνεχώς λέξεις-κλειδιά ή αγοράζοντας συνδέσμους που εγκρίνονται από την κατάταξη σελίδας. Αυτοί οι ιστότοποι παρέχουν μια πολύ κακή εμπειρία χρήστη και μπορούν ακόμη και να βλάψουν ή να παραπλανήσουν τους χρήστες του Google. Για αυτό τον λόγο, δημιουργούμε αλγορίθμους για τον εντοπισμό ανεπιθύμητου περιεχομένου και την κατάργηση ιστοτόπων που παραβαίνουν τις οδηγίες για webmasters της Google από τα αποτελέσματά μας.

    Το περιεχόμενο στον ιστό και το ευρύτερο οικοσύστημα πληροφόρησης αλλάζουν συνεχώς και υπολογίζουμε και αξιολογούμε ασταμάτητα τα συστήματά μας, προκειμένου να διασφαλίσουμε ότι επιτυγχάνουν τη σωστή ισορροπία συνάφειας πληροφοριών και κύρους, προκειμένου να διατηρήσουμε την εμπιστοσύνη σας στα αποτελέσματα που βλέπετε.

  • Εμφάνιση των καλύτερων αποτελεσμάτων

    Εμφάνιση των καλύτερων αποτελεσμάτων

    Προτού προβάλουμε τα αποτελέσματά σας, αξιολογούμε τον τρόπο με τον οποίο όλες οι σχετικές πληροφορίες ταιριάζουν μεταξύ τους: Υπάρχει μόνο ένα θέμα μεταξύ των αποτελεσμάτων αναζήτησης ή πολλά; Μήπως υπάρχουν υπερβολικά πολλές σελίδες που εστιάζουν σε μια στενή ερμηνεία; Προσπαθούμε να παρέχουμε ένα διαφοροποιημένο σύνολο πληροφοριών σε μορφές που είναι όσο το δυνατόν πιο χρήσιμες για τον τύπο αναζήτησης που επιλέξατε. Ενώ, καθώς ο ιστός εξελίσσεται, εξελίσσουμε τα συστήματα κατάταξης για να παρέχουμε καλύτερα αποτελέσματα για περισσότερα ερωτήματα.

    Αυτοί οι αλγόριθμοι αναλύουν ενδείξεις που υποδεικνύουν το αν όλοι οι χρήστες μπορούν να δουν το αποτέλεσμα, όπως αν ο ιστότοπος εμφανίζεται σωστά σε διαφορετικά προγράμματα περιήγησης, αν είναι σχεδιασμένος για όλους τους τύπους και τα μεγέθη συσκευών, συμπεριλαμβανομένων των υπολογιστών, των tablet και των smartphone και αν οι χρόνοι φόρτωσης της σελίδας είναι ικανοποιητικοί για χρήστες με αργές συνδέσεις στο διαδίκτυο.

    Επειδή οι κάτοχοι ιστοτόπων μπορούν να βελτιώσουν τη χρηστικότητα του ιστοτόπου τους, προσπαθούμε σκληρά, προκειμένου να τους ενημερώνουμε εκ των προτέρων για σημαντικές αλλαγές στους αλγόριθμους της Αναζήτησης που απαιτούν ενέργεια. Για παράδειγμα, τον Ιανουάριο του 2018 ανακοινώσαμε ότι οι αλγόριθμοι θα ξεκινήσουν να λαμβάνουν υπόψη την "ταχύτητα σελίδας" των ιστοτόπων, έξι μήνες προτού εφαρμοστούν οι αλλαγές. Για να βοηθήσουμε τους κατόχους ιστοτόπων, παρείχαμε λεπτομερείς οδηγίες και εργαλεία, όπως είναι το PageSpeed Insights και το Webpagetest.org, προκειμένου οι κάτοχοι ιστοτόπων να μπορέσουν να δουν τι χρειάζεται να αλλάξουν (αν υπήρχε κάτι), για να κάνουν τους ιστοτόπους τους πιο φιλικούς προς κινητά.

    Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με τα εργαλεία καθώς και συμβουλές που παρέχει η Google στους κατόχους ιστοτόπων εδώ .

  • Εξέταση του γενικότερου πλαισίου

    Εξέταση του γενικότερου πλαισίου

    Πληροφορίες όπως η τοποθεσία σας, το προηγούμενο ιστορικό αναζήτησης και οι ρυθμίσεις της Αναζήτησης μάς βοηθούν να προσαρμόσουμε τα αποτελέσματά σας σε ό,τι είναι πιο χρήσιμο και συναφές για εσάς τη συγκεκριμένη στιγμή.

    Χρησιμοποιούμε τη χώρα και την τοποθεσία σας για να παρέχουμε περιεχόμενο σχετικό με την περιοχή σας. Για παράδειγμα, εάν βρίσκεστε στο Σικάγο και κάνετε αναζήτηση για τον όρο "ποδόσφαιρο", το Google πιθανότατα θα σας δείξει πρώτα αποτελέσματα για το αμερικανικό ποδόσφαιρο και την ομάδα των Chicago Bears. Αντιθέτως, αν κάνετε αναζήτηση για τον όρο “ποδόσφαιρο” στο Λονδίνο, το Google θα κατατάξει σε υψηλότερη θέση τα αποτελέσματα που αφορούν το ευρωπαϊκό ποδόσφαιρο και την Premier League. Οι ρυθμίσεις της Αναζήτησης είναι επίσης μια σημαντική ένδειξη για τα αποτελέσματα που πιθανόν να σας φανούν χρήσιμα, όπως εάν ορίσετε μια προτιμώμενη γλώσσα ή επιλέξετε την Ασφαλή Αναζήτηση (ένα εργαλείο που σας βοηθά να φιλτράρετε άσεμνα αποτελέσματα).

    Σε ορισμένες περιπτώσεις, ενδέχεται επίσης να εξατομικεύσουμε τα αποτελέσματά σας χρησιμοποιώντας πληροφορίες σχετικά με την πρόσφατη δραστηριότητά σας στην Αναζήτηση. Για παράδειγμα, αν αναζητήσετε τον όρο "Μπαρτσελόνα" και πρόσφατα αναζητήσατε "Μπαρτσελόνα εναντίον Άρσεναλ", αυτό θα μπορούσε να είναι μια σημαντική ένδειξη ότι θέλετε πληροφορίες σχετικά με τον ποδοσφαιρικό σύλλογο, όχι την πόλη. Μπορείτε να ελέγξετε ποια δραστηριότητα αναζήτησης χρησιμοποιείται για τη βελτίωση της εμπειρίας σας στην Αναζήτηση, συμπεριλαμβανομένης της ρύθμισης των δεδομένων που αποθηκεύονται στον Λογαριασμό σας Google, στη διεύθυνση myaccount.google.com.

    Η Αναζήτηση περιλαμβάνει, επίσης, ορισμένες λειτουργίες που εξατομικεύουν τα αποτελέσματα με βάση τη δραστηριότητα στον Λογαριασμό σας Google. Για παράδειγμα, αν αναζητήσετε "εκδηλώσεις κοντά μου", το Google μπορεί να προσαρμόσει ορισμένες προτάσεις σε κατηγορίες εκδηλώσεων που πιστεύουμε ότι μπορεί να σας ενδιαφέρουν. Αυτά τα συστήματα έχουν σχεδιαστεί, για να αντιστοιχούν στα ενδιαφέροντά σας, και όχι, για να εξάγονται συμπεράσματα σχετικά με ευαίσθητα χαρακτηριστικά σας, όπως είναι η φυλή, η θρησκεία ή το πολιτικό κόμμα που υποστηρίζετε.

    Μπορείτε να ελέγξετε ποια δραστηριότητα αναζήτησης χρησιμοποιείται για τη βελτίωση της εμπειρίας σας στην Αναζήτηση, συμπεριλαμβανομένης της ρύθμισης των δεδομένων που αποθηκεύονται στον Λογαριασμό σας Google, στη διεύθυνση myaccount.google.com. Για να απενεργοποιήσετε την εξατομίκευση της Αναζήτησης με βάση τη δραστηριότητα στο λογαριασμό σας, απενεργοποιήστε την επιλογή "Δραστηριότητα ιστού και εφαρμογών".