Riassunto analitico
Attualmente i motori di ricerca svolgono un ruolo importante sia per quanto riguarda la diffusione e la fruizione della rete sia nella vita quotidiana di ogni persona. Infatti essi sono il mezzo attraverso il quale, in un modo che ormai è diventato naturale, si cercano determinati contenuti. Quindi dal lato dei fornitori di contenuto rappresentano un tramite fondamentale per mostrare i propri materiali e avere conseguentemente una rendita da essi; ciò vale per la maggioranza dei siti indipendentemente dal fatto che offrano notizie, intrattenimento o altri servizi specifici. Dall’altro lato sono il mezzo preferito da parte degli utenti per soddisfare il proprio bisogno informativo oppure per raggiungere un determinato sito senza dover ricordarsi e inserire l’indirizzo completo. Per questo motivo, negli ultimi vent’anni, sono nati e si sono evoluti innumerevoli motori di ricerca, diventando anche leader nell’intero settore informatico. Assieme ai motori in sé, sono state studiate, sia in ambito commerciale sia in ambito accademico, diverse tecniche per trovare certe parole chiave inserite dall’utente cercando in oltre un miliardo di pagine web attuali. Tali tecniche però si applicano solo al testo contenuto nelle pagine web, che per sua natura è prevalentemente di tipo non strutturato. Al contrario, certe fonti di informazione tipiche dell’informatica (quali i database) sono di natura strutturata e le tecniche per la ricerca nelle pagine web non funzionano se applicate ad esse. Ciò succede soprattutto per due motivi: innanzitutto la ricerca nei database richiede una conoscenza della loro struttura che non si può chiedere ad un utente semplice; in secondo luogo si basa su corrispondenze esatte, un vincolo troppo restrittivo per la ricerca non strutturata. Nel corso degli anni sono state proposte in letteratura tecniche di ricerca di parole chiave, che però non si sono diffuse granché. In questa tesi si descriverà un nuovo approccio finalizzato alla ricerca di parole chiave all’interno dei database relazionali utilizzando tecniche simili a quelle progettate per le pagine web.
|