Web directory - Definizione, storia e caratteristiche

Una web directory è un sito internet che raccoglie, cataloga e descrive altri siti web al fine di suddividerli e raggrupparli per categoria, tipologia o chiavi identificative ( tags ), in modo da agevolarne il reperimento e la valutazione da parte degli utenti. Una web directory, pertanto, si prefigge tipicamente il duplice scopo di:

  • Realizzare elenchi di siti affini per materia o attività trattata
  • Promuovere i siti che cataloga

Indice

  1. Storia
    1. Le prime web directory
    2. I motori di ricerca e la nascita della SEO
    3. L’avvento di Google e dell’algoritmo del PageRank
    4. Le web directory SEO del passato
    5. Le penalizzazioni delle web directory di scarso valore
    6. La nuova generazione di web directory
  2. Principali benefici derivanti dalla presenza in una web directory
  3. Modalità di inserimento di un sito in una directory
  4. Principali tipologie di directory e relativi modelli di business
    1. Directory a pagamento
    2. Directory gratis con servizi a pagamento
    3. Directory a scambio link
  5. Organizzazione gerarchica delle directory
    1. Problematiche tipiche legate alla categorizzazione
    2. Approcci alternativi alla categorizzazione classica
      1. Limitazione delle categorie
      2. Utilizzo delle tags
  6. Differenze ed analogie con i motori di ricerca
    1. Individuazione di pagine e siti da aggiungere
    2. Natura delle informazioni trattate
    3. Catalogazione dei siti
    4. Ricerche degli utenti
  7. Punti di forza e di debolezza a confronto

Storia

Le prime web directory

Le web directory nascono agli albori del WWW, tra la metà e la fine degli anni 90, per rispondere all’esigenza di reperire i siti in una rete internet non ancora dominata dai motori di ricerca ma che comprendeva al suo interno già centinaia di migliaia di siti ed un numero ancora maggiore di pagine e documenti ad essi collegati.
Benchè le tecniche e gli algoritmi di information retrieval alla base dei futuri motori di ricerca fossero oggetto di studio già dagli anni ’70, in quel tempo non avevano ancora trovato concreta ( ed efficace ) applicazione in un ambito vasto, eterogeneo e distribuito quale quello del neonato WWW.
Di conseguenza, il miglior metodo per aiutare gli utenti a trovare i siti di loro interesse era quello di catalogarli a mano e categorizzarli in grandi archivi pubblici navigabili con gli antenati dei browser attuali.
I due capostipiti del settore furono la Directory di Yahoo e la Directory ODP, quest’ultima conosciuta anche come DMOZ, nate rispettivamente nel 1994 e nel 1998.
Entrambe le web directory già in quegli anni archiviavano centinaia di migliaia di url.
DMOZ, in particolare, nel 2004 memorizzava qualcosa come oltre 4 milioni di voci organizzate in circa 590.000 categorie, un lavoro immane frutto dello sforzo di decine di migliaia di redattori in tutto il mondo.
Quando i motori di ricerca iniziarono a diffondersi, con Altavista prima e con Google poi, le web directory persero un po’ della loro utilità agli occhi dei navigatori, soprattutto per via dell’intrinseca difficoltà di identificare la corretta categoria di ciò che si intendeva trovare.
Continuarono comunque a svolgere un ruolo determinante per i motori di ricerca che le utilizzavano massivamente per reperire nuove URL e per ottenere informazioni su di esse.
Il lavoro di catalogazione manuale degli editori, infatti, aiutava i software dei motori di ricerca, all’epoca molto meno intelligenti rispetto ad oggi, a capire di cosa trattasse un determinato sito, consentendo loro di fornire risposte più pertinenti rispetto alle query immesse dagli utenti.

I motori di ricerca e la nascita della SEO

Con il contemporaneo diffondersi dei primi motori di ricerca, tra i quali menzioniamo Lycos ed Altavista, due tra i più popolari in Italia, nasce la SEO, la pratica dell’ottimizzazione di un sito al fine di favorirne il posizionamento tra i risultati delle ricerche.
Già all’epoca, infatti, appariva evidente l’importanza di apparire tra i primi risultati di una determinata interrogazione.
Non essendo ancora entrate in gioco le relazioni tra i siti nella valutazione del ranking, detta ottimizzazione era svolta essenzialmente all'interno del sito, lavorando in massima parte sui testi delle pagine. Da qui il termine, utilizzato ancora oggi, di "SEO in page".
Poiché i motori di quegli anni, comunque, erano molto meno sofisticati di quelli di oggi e molto meno resistenti ai tentativi di manipolazione, la pratica usuale, utilizzata anche in buona fede dai webmaster, era quella di aggiungere il maggior numero di parole chiave possibile nelle proprie pagine in modo da “aiutare” il motore di ricerca a capire il significato del testo.
Purtroppo, comunque, l’utilizzo di quella tecnica fu ampiamente abusato, finendo per degradare la qualità complessiva dei testi dei siti e la conseguente qualità generale dei risultati delle ricerche.
Non era infrequente, infatti, che le pagine venissero colmate di keywords anche NON pertinenti al significato e al contenuto della pagina stessa, allo scopo di intercettare le ricerche del maggior numero possibile di utenti a fini promozionali e commerciali.
Detta pratica venne battezzata con l’appropriato termine di “keywords stuffing” ed involontariamente contribuì al successo di Google.

L’avvento di Google e dell’algoritmo del PageRank

Google nasce nel 1998 ad opera di Larry Page e Sergey Brin, all’epoca due studenti dell’università di Stanford.
I due informatici pensavano che un motore di ricerca basato sull'analisi matematica delle relazioni tra i siti web potesse fornire risultati migliori rispetto a quanto restituito dai motori di ricerca del tempo e a partire da questo concetto elaborarono la teoria per la quale le pagine linkate da un maggior numero di altri siti dovessero avere un peso maggiore nell'ordinamento dei risultati rispetto alle altre.
Questa teoria, che in seguito si concretizzerà nel noto algoritmo del “Pagerank”, determina il successo di Google ed inaugura la stagione della SEO “off page”.
La definizione "SEO off page" sta per "ottimizzazione per i motori di ricerca svolta all'esterno della pagina/sito web", e nel contesto della relazione tra posizionamento nei risultati e numero di link verso il proprio sito data dall'algoritmo del pagerank, è riassumibile in quell'insieme di pratiche finalizzate in un modo o nell'altro all'ottenimento del maggior numero di link possibili.

Le web directory SEO del passato

Siamo nei primi anni del 2000. Lo spostamento di peso tra l’ottimizzazione SEOin page”, che continua comunque ad avere la sua importanza, e l’ottimizzazione SEOoff page” quale descritta nel paragrafo precedente, comporta l’inizio della ricerca di metodi, più o meno onesti, per ottenere link verso i propri siti.
Uno di questi metodi, generalmente quello considerato il più semplice, era senz’altro rappresentato dall’inserimento del proprio sito in una delle tante web directory disponibili.
In quegli anni, infatti, vista la popolarità e l'autorevolezza acquisita nel frattempo da DMOZ e soprattutto per via dell’acquisita consapevolezza del valore dei link agli occhi dei motori di ricerca, tali tipologie di siti nascevano e si moltiplicavano senza sosta.
Queste web directory, spesso appropriatamente ribattezzate con l'appellativo di "directory SEO", erano quasi sempre basate su script preconfezionati, erano tutte piuttosto simili tra loro e, ben lungi dal proporsi i meritevoli obiettivi di ODP o Yahoo, miravano quasi esclusivamente ad aumentare il proprio pagerank al fine di risultare appetibili a chi voleva acquistare link da portali ad alto PR, e pertanto ponevano nessuna o scarsissima attenzione alla qualità dei siti catalogati.
L'aumento del valore di pagerank era ottenuto grazie ad un pratica estremamente comune in quegli anni, che era quella di chiedere un link ( “backlink”, o "link reciproco" ) in cambio dell’inserimento del sito nella directory. Di fatto un meccanismo di scambio link automatizzato.
Lo schema che si veniva a creare, sia per le directory che per i siti web era a tutti gli effetti un molti-a-uno:

  • Molti diversi siti linkavano una singola web directory ( per via del backlink )
  • Molte diverse web directory linkavano un singolo sito

web directory backlink schema

Lo schema, ovviamente, favoriva le web directory, che riuscivano a concentrare un gran numero di backlink verso le proprie homepage, ma risultava conveniente anche per i titolari dei siti web, che ripetendo la pratica per le molte directory esistenti allora ottenevano un alto numero di link e buoni valori di pagerank.
La cosa però aveva la controindicazione di deteriorare la qualità dei risultati dei motori di ricerca che si trovavano a dover trattare con siti dall’alto PR, quindi idealmente "meritevoli" di posizionarsi in alto negli elenchi di risultati, ma dallo scarso valore dei contenuti.

Le penalizzazioni delle web directory di scarso valore

Quando i motori di ricerca, Google in particolare, percepirono che la massa di link provenienti dalle migliaia di web directory e di siti di scarso valore dell’epoca, unitamente a molte altre pratiche ai limiti del lecito molto in voga in quegli anni, stavano azzerando il senso stesso dei loro sofisticati algoritmi, intervennero in maniera decisa.
Già a partire dal 2006 vennero introdotti algoritmi che penalizzavano i siti con un gran numero di link reciproci.
E in seguito, soprattutto per mezzo dei noti algoritmi “Panda” e “Penguin”, vennero presi di mira sia i siti che ottenevano link a pagamento che quelli con contenuti di bassa qualità ( magari copiati ).
Questo segnò la fine di tutte le web directory e di tutti quei siti che, effettivamente, facevano largo uso di tutti gli espedienti di cui sopra e che non apportavano alcun valore né agli utenti né ai motori di ricerca stessi.
Per anni però, nella comunità SEO, è rimasta la convinzione che le misure introdotte da Google fossero rivolte alle web directory in quanto tali e non alle directory che :

  • Non apportavano alcun controllo editoriale
  • Ospitavano siti di SPAM o di scarsissima qualità
  • Non verificavano neanche periodicamente lo stato dei propri link
  • Chiedevano il backlink per l’inserimento

Con il risultato che, fino a poco tempo fa, molte di esse sono state ingiustamente e immotivatamente considerate addirittura nocive per il posizionamento.

La nuova generazione di web directory

Con il passare del tempo e con una maggior comprensione dei meccanismi di ranking dei motori di ricerca da parte della comunità SEO internazionale, il pregiudizio nei confronti delle web directory si è sensibilmente attenuato e si ritorna oggi ad assistere alla nascita di contenitori in grado di apportare reale valore ai siti catalogati.
In particolare, le web directory moderne hanno quasi del tutto abbandonato la pratica di chiedere il backlink e al fine di limitare gli abusi hanno iniziato a linkare con l’ancoraggio sul nome del dominio e non più su una keyword SEO.
Molte altre, addirittura, forse con un eccessivo senso di zelo nei confronti delle direttive suggerite dai motori di ricerca, hanno del tutto sterilizzato i link in uscita con il nofollow o attraverso meccanismi di redirect.
In ogni caso, nell’ottica di apportare valore agli utenti, molta attenzione è posta nell'impedire la pubblicazione di testi duplicati, e la cruda categorizzazione di un tempo, spesso mutuata così com’era dagli script preconfezionati in stile “ESyndicat” che spopolavano all’epoca, viene affiancata a meccanismi di etichette e tags tipici dei blog.
Molta più cura, infine, è dedicata ai motori di ricerca interna, che si avvalgono oggi dei cataloghi full-text dei database relazionali moderni mentre le migliori web directory del settore preparano addirittura i testi per proprio conto.


segnala il tuo sito alla directory Uhelà


Principali benefici derivanti dalla presenza in una web directory

Storicamente l'aggiunta di un sito ad una web directory veniva eseguita avendo principalmente in mente l'obiettivo della link building/link popularity, l'aumento cioè del numero di link verso il proprio sito volto all'incremento del PageRank e al conseguente miglioramento del posizionamento sui motori di ricerca.
E in effetti, con l'esclusione delle directory DMOZ e Yahoo, che per dimensioni ed autorevolezza rappresentavano un caso a parte, non c'erano molti altri motivi per farlo, dato che il traffico proveniente da esse era in genere quasi del tutto assente.
Con l'introduzione degli algoritmi antispam di Google e la conseguente epurazione di molti dei "siti spazzatura" dell'epoca, le directory ed i siti web in genere dovettero dare un senso diverso alla propria presenza sul web.
Oggi, di conseguenza, l'inserimento di un sito nelle directory ( o perlomeno nelle migliori di esse ) comporta una serie di benefici in più.

  • Miglioramento del profilo link

    Ancorchè ridimensionato rispetto al passato, il cosiddetto "profilo link di un sito" gioca ancora un ruolo importante nel posizionamento organico dei motori di ricerca.
    Checchè se ne dica, indipendentemente dalla validità dei contenuti proposti, un buon numero di link verso il proprio sito è ancora un fattore che può fare la differenza.
    Le web directory rappresentano uno strumento che consente di ottenere link diretti in modo più immediato rispetto a quanto necessario con il guest posting o con altre tecniche più avanzate di link building.

  • Traffico

    Le directory odierne tendono oggi a porsi più come portali che come raccolte di link. Di conseguenza le descrizioni dei siti vengono generalmente inserite in una pagina propria con URL, tag title e meta description opportunamente impostati.
    E molta più cura è posta nella redazione dei testi, che hanno quasi sempre requisiti minimi di lunghezza e che, assolutamente, devono essere originali.
    Di conseguenza, i motori di ricerca tendono oggi ad indicizzare dette pagine più che le pagine delle categorie e spesso, soprattutto nel caso di keywords non eccessivamente competitive, le posizionano bene nei risultati delle ricerche, portando traffico al sito di destinazione.
    In questo senso una pagina dedicata ad un sito web su una web directory non è poi così dissimile da un guest post dedicato ad un sito web su un blog.

  • Rafforzamento del brand

    Soprattutto nella fase di startup, per un sito web è necessario rafforzare il proprio brand, sia ottenendo link o citazioni sia facendo trovare ai motori di ricerca e ai navigatori il maggior numero possibile di descrizioni della propria attività.
    L'associazione brand/attività, infatti, è alla base del sentimento di fiducia che i navigatori ripongono nelle attività commerciali.
    Descrivere l'attività di un sito in una web directory è un modo semplice e generalmente gratuito per ottenere questo scopo, soprattutto considerando che di web directory valide ce ne sono molte e che le migliori di esse iniziano anche a ripubblicare le proprie pagine sui maggiori social network.

Modalità di inserimento di un sito in una directory

I siti presenti in una web directory vengono generalmente aggiunti manualmente a fronte di una segnalazione dei rispettivi titolari.
Non mancano comunque le web directory che, eventualmente con l'aiuto di spider e crawler proprietari, individuano ed aggiungono autonomamente ai propri elenchi i siti che ritengono di interesse.
La segnalazione avviene generalmente per il tramite di una form ma possono variare, e di molto, quantità e tipologia di informazioni richieste.
Alcune web directory, ad esempio, oltre all’URL del sito chiedono di specificare uno o più categorie di appartenenza, di indicare le keywords più pertinenti, di fornire delle immagini e di descrivere l’attività del sito con un testo che può anche imporre limiti minimi di lunghezza ( carattere e/o parole ) piuttosto lunghi.
Altre, più spartane, si accontentano dell’URL, di una categoria e di una descrizione anche molto breve.

Principali tipologie di directory e relativi modelli di business

Le web directory possono essere suddivise in due grandi categorie, quelle generaliste e quelle tematiche.
Le prime raccolgono i siti di ogni tipologia, inserendoli poi nell'opportuna categoria. Le seconde si focalizzano su una tematica specifica. Ad esempio, sono molto diffuse le directory dedicate al turismo, che raccolgono siti di alberghi, case vacanza o agriturismi.
A seguito dell'introduzione degli algoritmi antispam di Google si è diffusa la convinzione che le uniche directory alle quali fosse utile aggiungere un sito a fini SEO fossero solo le seconde, per via della forte tematicità dell'intero sito.
In realtà andrebbe ricordato che è il contesto della pagina ove è posto il link a determinarne la maggior parte del valore. Quindi, se la web directory dedica una pagina al sito e la descrizione posta in essa è ragionevolmente ricca, non c'è motivo di sostenere che il link non abbia valore.
E peraltro bisogna sempre tenere a mente che i singoli siti sono pur sempre calati all'interno di una categoria omogenea ove i link in uscita, quindi, sono tutti del medesimo genere.
All'interno delle due macrocategorie citate è possibile effettuare ulteriori distinzioni, soprattutto legate al modello di business adottato dalla directory:

  • Directory a pagamento

    Queste directory chiedono un pagamento a fronte dell'inserimento, richiesto in genere per via del lavoro necessario a valutare il sito o, eventualmente, per correggere le descrizioni proposte.
    Alcune di queste, comunque, oltre al costo iniziale, chiedono un pagamento annuale per il mantenimento del sito.

  • Directory gratuite

    Le directory gratis, tipicamente, inseriscono gratuitamente i siti proposti ma chiedono un pagamento in cambio di servizi aggiuntivi da attivare facoltativamente, come in genere accade per tutte le tipologie di siti "freemium".
    Alcune di queste, ad esempio, chiedono un pagamento per posizionare i siti in evidenza in appositi spazi ( generalmente in homepage ), per porli all'inizio delle relative categorie o per fornire servizi extra generalmente legati alla visibilità o alla celerità di inserimento e valutazione.

  • Le directory a scambio link sono quelle che chiedono ai responsabili del sito da inserire di aggiungere un backlink nelle loro pagine verso la directory stessa.
    Questi tipi di directory sono quelle guardate con maggior sospetto dai motori di ricerca, poichè la pratica dello "scambio link", pur legittima di per sé, è vista come un tentativo di manipolazione quando praticata in maniera generalizzata.

Organizzazione gerarchica delle directory

Le web directory sono caratterizzate dalla categorizzazione gerarchica dei siti in esse inseriti. Il concetto di "gerarchico" nasce dal fatto che quasi ogni attività umana può essere fatta risalire ad un insieme o a un genere, quasi sempre riconducibile a sua volta ad uno o più insiemi o generi più grandi che lo contengono.
Un sito che commercializza vini online, ad esempio, è prima di tutto un sito che si occupa di vendita online. E questa può rappresentare una prima classificazione.
Il vino, a sua volta, è una bevanda alcolica, che in quanto tale puo essere fatta risalire al genere più ampio dei prodotti alimentari, che potrebbero essere suddivisi a loro volta in cibi, bevande e via dicendo.
Questa organizzazione degli elementi, crea una gerarchia. Immaginando l'esempio precedente, avremmo qualcosa come :

categorie web directory

E il sito dell'esempio, quindi, sarebbe posto in :
Acquisti online/Prodotti alimentari/Bevande/Alcoliche/Vini e spumanti

Problematiche tipiche legate alla categorizzazione

Una gerarchia di categorizzazione simile a quella presentata nel paragrafo precedente è estremamente frequente nelle web directory ma porta con se più di un problema.
Se è vero che restringere il campo della categorizzazione sino al livello più prossimo all'argomento da trattare consente di inquadrare il sito nel miglior modo possibile, è anche vero che :

  • E' necessario compiere un elevato numero di click per raggiungere il livello desiderato
  • Nei casi meno ovvii è possibile intraprendere un percorso errato
  • Laddove la web directory lo preveda ( era il caso di DMOZ/ODP ) è possibile che più percorsi gerarchici portino al medesimo sito, causando incertezza nell'itinerario da scegliere

Approcci alternativi alla categorizzazione classica

Pur senza eliminare il concetto di categoria, alcune directory hanno provato ad apportare alcuni correttivi per risolvere, almeno in parte, le problematiche esposte nel paragrafo precedente.
Tali approcci alternativi sono basati sostanzialmente sulla limitazione delle sottocategorie e sull'utilizzo delle tags.

  • La limitazione delle sottocategorie

    La limitazione delle categorie è una tecnica volta a portare l'annidamento a non più di tre livelli e mira innanzitutto a ridurre il numero di click necessari al raggiungimento della categoria di proprio interesse.
    Nel caso dell'esempio precedente, l'applicazione di detta tecnica porterebbe in primo luogo ad eliminare la distinzione tra "cibi" e "bevande".
    Bisogna infatti tenere nella debita considerazione il mondo reale, ove è assolutamente raro che un rivenditore di prodotti alimentari tipici non venda anche vini e che un enoteca online non venda anche prodotti da conserva, olii ed altre specialità non strettamente inquadrabili nella categoria dei vini.
    Il taglio delle categorie "cibi" e "bevande", inoltre, porterebbe con se l'eliminazione delle sotto-categorie "Cibi dolci" e "cibi salati" del ramo dei cibi mentre, nel ramo delle bevande, eliminerebbe la differenziazione tra "bevande alcoliche" e "bevande analcoliche".
    Anche in questo caso, infatti, sarebbe difficile trovare commercianti dediti esclusivamente alla vendita di cibi dolci o salati oppure esclusivamente alle bevande analcoliche.
    Rifacendosi a quanto detto la gerarchia dell'esempio verrebbe ridotta a :

    web directory categorie ridotte


    Un taglio deciso da 5 click a 2 click per arrivare ad un elenco di siti che ora vedrebbe insieme venditori di cibi, venditori di bevande o entrambe le cose.

  • L'utilizzo di tags

    La riduzione delle sottocategorie, come esplicata nel paragrafo precedente, consente una drastica semplificazione della navigazione.
    Ma in uno scenario come quello sin qui descritto, giunti alla sottocategoria "Prodotti alimentari", ci si troverebbe ora di fronte ad un elenco di siti che comprenderebbe sia i venditori di bevande alcoliche che i venditori di pasta o caffè.
    Per distinguere tra le diverse tipologie senza reintrodurre le categorie lo strumento generalmente adottato è quello delle tags.
    Le tags, o etichette, sono un concetto mutuato dal mondo dei blog e rappresentano elenchi di parole chiave che in qualche modo identificano un contenuto.
    Rimanendo al tema dell'esempio, un sito di un'enoteca online potrebbe annoverare tra i propri prodotti vini rossi, vini bianchi, spumanti, distillati, birre e via dicendo, mentre il sito di un pastificio avrebbe tra i suoi prodotti penne, fusilli, sedani o farfalle.
    Ciascuno di questi prodotti può rappresentare un tag, un'etichetta, che opportunamente collegata ai rispettivi siti dà la possibilità di eseguire una selezione all'interno di una categoria.
    Speciale accortezza va comunque posta nell'impedire la proliferazione di tags simili, che non collegate uniformemente ai rispettivi siti ne impedirebbero la corretta selezione in fase di filtraggio.

Differenze ed analogie tra web directory e motori di ricerca

Web directory e motori di ricerca rappresentano tecnologie che nascono per assolvere all'esigenza di aiutare gli utenti a reperire le informazioni.
Le differenze tra entrambi sono sostanzialmente legate all'approccio utilizzato per l'aggiunta delle informazioni ai rispettivi indici, generalmente manuale nel caso delle directory e generalmente automatizzato nel caso dei motori di ricerca.
Le modalità di interrogazione ( e le conseguenti tecniche per il recupero dei risultati ), invece, possono variare grandemente in funzione di come le web directory sono state progettate, arrivando ad essere estremamente simili a quelle dei motori di ricerca qualora i progettisti della directory abbiano scelto di privilegiare la navigazione tra le categorie piuttosto che non la ricerca testuale o viceversa.

  • Individuazione di pagine e siti da aggiungere

    Le web directory, generalmente, aggiungono i siti ai loro archivi dietro segnalazione degli interessati. Molte di esse, comunque, operano anche di propria iniziativa, individuando e selezionando i siti da aggiungere eventualmente con l'aiuto di spider e crawler proprietari.
    I motori di ricerca individuano e archiviano pagine e siti per mezzo di sistemi e algoritmi interamente automatizzati. GoogleBot, Slurp e Romilda sono i nomi dei software bot ( spider ) utilizzati rispettivamente da Google, Yahoo e Facebook.

  • Natura delle informazioni trattate

    Le directory sono orientate al trattamento e alla catalogazione dei siti nel loro complesso, non ai contenuti delle singole pagine. Il lavoro di una directory è classificare e catalogare i siti web e loro relative attività per ottenere elenchi di siti organizzati per categorie omogenee. Ed è questo il motivo per il quale, storicamente, le directory adottano come meccanismo primario di ricerca la navigazione tra le categorie.
    I motori di ricerca, al contrario, sono orientati al trattamento dei documenti, laddove per documento può essere inteso un ipertesto, un'immagine o un file di qualche tipo. Un motore di ricerca intende un sito web come la somma dei documenti trovati in esso ed è per questo che in qualche caso, rispondendo ad una query che chiede un elenco ( "es. siti arredamento Roma" ), tende a restituire documenti ove quegli elenchi sono già stati redatti, In molti casi, anche pagine di web directory che riepilogano quella tipologia di siti ( PagineGialle, PagineBianche, etc. ).

  • Catalogazione dei siti

    La catalogazione dei siti è l'elemento distintivo delle web directory. Lo staff di una directory, dopo aver approvato l'aggiunta di un sito, provvede a porlo nella giusta categoria e/o ad identificarlo con le etichette ( tags ) opportune. Dette operazioni, eseguite generalmente in modo manuale, possono comunque essere effettuate anche con l'ausilio di strumenti automatizzati simili a quelli utilizzati dai motori di ricerca.
    I motori di ricerca non eseguono operazioni manuali di classificazione ed identificazione dei siti web, demandando ai propri algoritmi di IR ( information retrieval ) il compito di inferire la materia trattata a partire dal testo reperito nelle singole pagine.

  • Ricerche degli utenti

    La ricerca all'interno di una web directory è storicamente affidata alla navigazione tra le categorie. Perlomeno all'inizio, infatti, la ricerca testuale era possibile ma si limitava in massima parte a fornire come risultato un elenco di siti ove erano presenti le parole immesse, senza alcuna valutazione relativa alla pertinenza delle chiavi. Le directory più moderne, comunque, hanno iniziato ad affiancare alla navigazione tra le categorie sistemi di ricerca che implementano molti dei sistemi di IR adottati dai motori di ricerca, come l'espansione delle query, l'analisi della frequenza dei termini e la valutazione dei sinonimi.
    Non subendo alcun tipo di classificazione preventiva, i documenti e i testi archiviati da un motore di ricerca vengono recuperati esclusivamente per mezzo di algoritmi di information retrieval, che cercano di determinare per proprio conto quali siano i testi/siti più pertinenti in relazione all'interrogazione posta dall'utente.

Punti di forza e di debolezza a confronto

I siti che entrano a far parte del catalogo di una web directory, per definizione, sono stati preventivamente selezionati, valutati e controllati per quel che riguarda le descrizioni proposte. E in taluni casi, addirittura, dette descrizioni sono state preparate dallo staff della directory stessa. Le web directory, quindi, possono vantare un elevatissimo grado di qualità delle informazioni memorizzate e restituite in fase di ricerca. Ma tutto questo, naturalmente, al prezzo della ridotta quantità di siti web che hanno la possibilità di trattare, legata ovviamente al processo spesso manuale necessario a compiere tutte le attività menzionate.
I motori di ricerca, invece, che per loro natura ambiscono ad essere universali, non possono effettuare alcun tipo di valutazione e controllo preventivo sui testi. Per poter provare a fornire la miglior risposta ad una query di un utente devono necessariamente archiviare ed indicizzare OGNI contenuto che trovano, demandando tutte le valutazioni qualitative e di pertinenza al momento della restituzione dei risultati. E' evidente, quindi, che il principale punto di debolezza dei motori di ricerca, se di questo si può parlare, risiede nel rapporto tra qualità e quantità dei dati indicizzati e nelle conseguenti ingenti risorse necessarie, sia in termini di hardware che di risorse umane in grado di gestirne la complessa architettura.
In definitiva, Web directory e motori di ricerca rappresentano strumenti complementari.
Le web directory hanno come loro punto di forza la classificazione preventiva e la loro natura "site oriented", che le rende perfette per ottenere elenchi di siti affini per tipologia o attività ma che le rende pressochè inutili per cercare testi e documenti.
I motori di ricerca, d'altro canto, per la loro natura "document oriented" hanno la capacità di reperire testi, frasi e documenti in un archivio, il web, che può ormai essere considerato praticamente infinito, ma per la loro meccanica di archiviazione e per la difficoltà di interpretare correttamente alcune delle query degli utenti non sono sempre a loro agio nel restituire elenchi di siti distinti per categoria.

 
Cos'è Uhelà?

C'è vita oltre i motori di ricerca? Si, c'è. È su Uhelà, la web directory che cataloga a mano i migliori siti internet con una intera pagina dedicata e tutte le informazioni per trovare quello che cercavi davvero.

Ditemi di più…
Seguici ( qui e li... )
Note legali

Tutto "l'avvocatese" che c'è da sapere su Uhelà…

Contatti

Vuoi chiederci qualcosa? Vuoi mandarci un saluto?

Contattaci qui!