Nome
Cognome
Email
Password
Ho letto e accetto l'informativa sulla privacy
Desidero ricevere la Newsletter di PMI-dome.com
FacebookTwitterRSS
PMI Dome

La terza generazione dei motori di ricerca (Parte I)

I cambiamenti in arrivo: come si è giunti a questa decisione e quali impatti si generano per chi gestisce il proprio sito.
di Lucio Miranda - Inet@Italia | 15 novembre 2001

È ormai nozione comune che i motori di ricerca cambiano costantemente le regole con cui indicizzano e catalogano le pagine web. Le ragioni di questo continuo cambiare sono due: il numero di pagine pubblicate online cresce a dismisura e con esso cresce il tentativo di "ingannare" i motori di ricerca per cercare di conquistare posizioni da capoclassifica per le proprie pagine.

Una delle tecniche più comunemente impiegate a tale scopo è la creazione delle cosiddette pagine "gateway". In molti casi si tratta di pagine uguali l’una all’altra con solo dei minimi cambiamenti nel testo per promuovere l’una o l’altra parola chiave.

L’obiettivo dei motori di ricerca è totalmente opposto: estrarre dal mucchio pagine che siano rilevanti per la ricerca effettuata e levare di mezzo pagine che sono in buona sostanza dei gran doppioni.

Questa, in breve, è la situazione.

Cambiamenti profondi si stanno profilando all’orizzonte con l’emergere di quella che viene ormai definita la "terza generazione" dei motori di ricerca. Questo articolo si pone come obiettivo di spiegare come i motori di ricerca siano arrivati alla decisione di implementare una terza generazione dei loro sistemi di ricerca, indicizzazione e catalogazione e quale sarà l’impatto su tutti noi comuni mortali.

Tre generazioni di motori di ricerca

Agli albori della storia di Internet i motori di ricerca basavano la catalogazione dei siti basandosi sul testo della pagina e sulla densità delle parole di ricerca e la Prima Generazione aggiunse i META Tags ai criteri di decisione.

Con la Seconda Generazione, quella attualmente ancora largamente in uso, i motori di ricerca hanno cominciato ad analizzare:

  • Popolarità della pagine: quantità e qualità dei link verso la nostra pagina. In questo senso un link da YAHOO! conta molto di più di un link che arriva dalla ditta Rossi.com
  • Permanenza: quanto più lunghe sono le permanenze medie dei visitatori del nostro sito, tanto più alta sarà la sua rilevanza.

La Terza Generazione (G3) nello sviluppo dei motori di ricerca si sta affacciando adesso sulla scena. È da chiarire che i motori di ricerca sono sempre gli stessi: si evolvono passando dalla Prima alla Terza generazione con la applicazione di nuove tecniche di indicizzazione e catalogazione ma i nomi rimangono quelli che conosciamo ormai da sempre: Excite, Lycos, Inktomi etc.

Page Vector (PV) e Term Vector (TV)

La spiegazione tecnica di queste due nuove categorie di analisi è piuttosto complicata. Di seguito cercherò di renderla semplice ed intuitiva. Pur nella semplificazione e nella approssimazione dei concetti, la spiegazione coglie gli aspetti essenziali dei fenomeni indagati.

  • Core sites - L’insieme dei siti relativi ad argomenti omogenei presenti nell’indice di un motore di ricerca rappresenta il "core". Ad esempio, se un MR ha già catalogato 5000 siti che trattano di gioielleria, questi siti rappresentano il "core" dei siti di gioielleria. Quando registrerete il vostro sito (e voi siete dei produttori di gioielli ..) il vostro sito verrà confrontato con il "core" dei siti di gioielleria.

  • PV - I motori G3 fanno l’analisi di tutte le pagine di ciascun "core" e calcolano un Page Vector, in pratica danno un "voto" a ciascuna pagina presente nel loro indice e relativa ad un certo argomento. Ad esempio, prendiamo la gioielleria. Il MR analizzerà le caratteristiche di tutte le pagine relative alla gioielleria presenti nell’indice ed assegnerà un voto a ciascuna di esse. La media dei voti, o altre manipolazioni statistiche di tali voti, sarà il PV.

  • TV - Supponiamo che siate dei produttori di gioielli. Supponiamo che produciate gioielli in argento, monili da indossare. Supponiamo che abbiate registrato il vostro sito con un motore G3. Il MR analizzerà le caratteristiche della vostra pagina e le assegnerà un Term Vector. Il TV viene poi comparato con il PV assegnato al "core" della gioielleria ed il confronto determina la posizione del vostro sito nell’indice (in altre parole, il confronto determinerà se il vostro sito apparirà al primo posto, al millesimo posto oppure in una posizione intermedia).

Più il TV è vicino al PV più il vostro sito aumenterà di rilevanza. L’ideale sarebbe di far sì che il vostro sito sia inserito nel "core" della gioielleria. È da notare che il "core" è un numero chiuso, per ogni sito di gioielleria che entra nel "core" della gioielleria un altro sito di gioielleria viene eliminato. Al momento Inktomi accetta registrazioni a pagamento per siti da inserire nei vari "core" del loro indice. Un occasione da non perdere.

Incoraggio un vostro feedback via email. Il mio indirizzo e’: mail@inetitalia.com

di Lucio Miranda

L'autore di questo articolo è Lucio Miranda.
Tutti i diritti riservati. E' vietata la riproduzione con qualsiasi mezzo, anche elettronico, di tutto o parte dell'articolo senza autorizzazione scritta dell'autore. 2001

Condividi

Lascia un commento

Nome:

Mail:

Oggetto:

Commento:

CAPTCHA

Codice controllo:






Inserisci il codice dell'immagine

CAPTCHA
  
Ho letto e accetto l'informativa sulla privacy



Come calcolare l'IMU

Due nuove aliquote e uno strumento per semplificare il calcolo

BIT 2012

La Borsa internazionale del Turismo riapre i battenti con tante importanti novità

Online il modello 730/12 editabile

Disponibile sul sito dell’Agenzia delle Entrate

La stampante ci spia

Uffici e aziende sono zeppe di stampanti con funzionalità sofisticate di scansione, stampa, copia, invio e ricezione fax, condivisione di rete... Ma siamo proprio sicuri che questi dispositivi non facciano niente altro che il loro onesto mestiere?
Accesso rapido