Τετάρτη, 12 Ιανουαρίου 2011

Μηχανές αναζήτησης πριν το Google και αδυναμίες


Μέχρι πριν την εμφάνιση του Google, η αξιολόγηση των ιστοσελίδων από τις προϋπάρχουσες «μηχανές αναζήτησης» (όπως το yahoo και το altavista) γινόταν με δύο τρόπους:

1.      Ο πρώτος ήταν με «χειροκίνητο» τρόπο, δηλαδή οι υπάλληλοι κάθε μηχανής αξιολογούσαν με το δικό τους υποκειμενικό τρόπο την αξία των ιστοσελίδων και τις τοποθετούσαν σε μια «λίστα προτεραιότητας». Φυσικά, αυτός ο τρόπος έβγαζε προσεγμένα αποτελέσματα, αλλά απαιτούσε χιλιάδες εργατοώρες (είχε δηλαδή μεγάλο κόστος). Έδινε επίσης πολύ λίγα αποτελέσματα, γιατί ήταν εξαιρετικά δύσκολο οποιαδήποτε εταιρεία να μπορεί να αξιολογεί αποτελεσματικά τον τεράστιο και καθημερινά αυξανόμενο αριθμό των ιστοσελίδων του Διαδικτύου. Το χειρότερο όμως για πολλούς ήταν ότι η «αξιολόγηση» ήταν πλήρως διαβλητή και μεροληπτική και ακολουθούσε τα συμφέροντα της εταιρείας που την έκανε.

2.      Ο δεύτερος τρόπος ήταν με τη μέτρηση των «σχετικών λέξων-κλειδιών» (keywords) για κάθε θέμα. Δηλαδή, οι μηχανές αναζήτησης δημιουργούσαν ένα αρχείο-δείκτη (index) με τις λέξεις που περιείχε η κάθε σελίδα και με τον αριθμό των επαναλήψεων αυτής της λέξης μέσα στο κείμενο. Όσο μεγαλύτερος ήταν ο δείκτης του αρχείου για την λέξη που αναζητούσε ο χρήστης, τόσο πιο «σχετική» θεωρούσε τη σελίδα η μηχανή και την εμφάνιζε πιο «μπροστά» στον χρήστη που έκανε την αναζήτηση. Αυτός ο τρόπος είχε προφανώς μικρότερο κόστος από τον προηγούμενο και γινόταν αυτόματα, άρα και πολύ πιο γρήγορα. Γρήγορα όμως φάνηκε η αδυναμία του: Οι πονηροί δημιουργοί που ήθελαν να προωθήσουν τις δικές τους ιστοσελίδες σε βάρος άλλων, επαναλάμβαναν χιλιάδες φορές τις ίδιες λέξεις μέσα σε κάθε σελίδα και έκαναν διάφορα κόλπα, όπως το να βάζουν «κρυφό κείμενο» (το οποίο μπορούσε να διαβάζει μόνο η μηχανή αναζήτησης) με ακόμη περισσότερες επαναλήψεις των λέξεων. Έτσι, έβγαιναν πάλι πρώτοι, ενώ γρήγορα η μηχανή αναζήτησης γινόταν άχρηστη, γιατί επέστρεφε μόνο «σκουπίδια», ειδικά στα πιο δημοφιλή θέματα...