È ormai nozione comune che i motori di ricerca cambiano costantemente le regole con cui indicizzano e catalogano le pagine web. Le ragioni di questo continuo cambiare sono due: il numero di pagine pubblicate online cresce a dismisura e con esso cresce il tentativo di "ingannare" i motori di ricerca per cercare di conquistare posizioni da capoclassifica per le proprie pagine.
Una delle tecniche più comunemente impiegate a tale scopo è la creazione delle cosiddette pagine "gateway". In molti casi si tratta di pagine uguali l’una all’altra con solo dei minimi cambiamenti nel testo per promuovere l’una o l’altra parola chiave.
L’obiettivo dei motori di ricerca è totalmente opposto: estrarre dal mucchio pagine che siano rilevanti per la ricerca effettuata e levare di mezzo pagine che sono in buona sostanza dei gran doppioni.
Questa, in breve, è la situazione.
Cambiamenti
profondi si stanno profilando all’orizzonte con l’emergere di quella
che viene ormai definita la "terza generazione" dei motori di ricerca. Questo
articolo si pone come obiettivo di spiegare come i motori di ricerca siano arrivati
alla decisione di implementare una terza generazione dei loro sistemi di ricerca,
indicizzazione e catalogazione e quale sarà l’impatto su tutti
noi comuni mortali.
Tre generazioni di motori di ricerca
Agli albori della storia di Internet i motori di ricerca basavano la catalogazione dei siti basandosi sul testo della pagina e sulla densità delle parole di ricerca e la Prima Generazione aggiunse i META Tags ai criteri di decisione.
Con la Seconda Generazione, quella attualmente ancora largamente in uso, i motori di ricerca hanno cominciato ad analizzare:
La Terza Generazione (G3) nello sviluppo dei motori di ricerca si sta affacciando adesso sulla scena. È da chiarire che i motori di ricerca sono sempre gli stessi: si evolvono passando dalla Prima alla Terza generazione con la applicazione di nuove tecniche di indicizzazione e catalogazione ma i nomi rimangono quelli che conosciamo ormai da sempre: Excite, Lycos, Inktomi etc.
Page Vector (PV) e Term Vector (TV)
La spiegazione tecnica di queste due nuove categorie di analisi è piuttosto complicata. Di seguito cercherò di renderla semplice ed intuitiva. Pur nella semplificazione e nella approssimazione dei concetti, la spiegazione coglie gli aspetti essenziali dei fenomeni indagati.
Più il TV è vicino al PV più il vostro sito aumenterà di rilevanza. L’ideale sarebbe di far sì che il vostro sito sia inserito nel "core" della gioielleria. È da notare che il "core" è un numero chiuso, per ogni sito di gioielleria che entra nel "core" della gioielleria un altro sito di gioielleria viene eliminato. Al momento Inktomi accetta registrazioni a pagamento per siti da inserire nei vari "core" del loro indice. Un occasione da non perdere.
Incoraggio un vostro feedback via email. Il mio indirizzo e’: mail@inetitalia.com
di Lucio Miranda
Tutti i diritti riservati. E' vietata la riproduzione con qualsiasi mezzo, anche elettronico, di tutto o parte dell'articolo senza autorizzazione scritta dell'autore. 2001 |