Riassunto analitico
Una grande quantità di siti Web, in particolare i siti ufficiali delle amministrazioni pubbliche e altre istituzioni contengono un gran numero di pagine Web con molte informazioni organizzate in categorie e sezioni nidificate che generalmente assumono una struttura ad albero di elevata complessità. In letteratura esistono diversi approcci e tecniche che affrontato il problema di miglioramento della “users'experience”, in questa tesi vengono proposti ed analizzati diversi approcci per fornire agli utenti suggerimenti personalizzati di pagine in grandi siti Web senza considerare la necessità di profili utente. Gli approcci considerano: 1)Conoscenza lessicale e semantica sulle pagine. Il contenuto delle pagine viene utilizzato per suggerire pagine con contenuti simili. L'attività di estrazione di parole chiave che rappresentano il contenuto delle pagine può essere pesante e complesso per alcuni siti Web. Per questo motivo, si è cercato di sfruttare l'URL come mezzo per approssimare questo contenuto. L’idea è basata sull'osservazione che in alcuni siti gli URL sono altamente esplicativi del contenuto, nel senso che essi contengono molte informazioni testuali sulle pagine ed il loro contesto. Va osservato che l'uso di URL descrittivi è una raccomandazione usuale per SEO (Search Engine Optimization); 2)Pagine del sito che l'utente ha visitato nella sessione corrente. Quindi, i link alle pagine proposte agli utenti tengono conto delle pagine egli ha appena visualizzato. Inoltre, i link suggeriti vengono aggiornati dinamicamente ogni volta che l’utente aggiunge una pagina alla sua sessione di navigazione. 3)Percorsi di navigazione (path) degli utenti precedenti. Analizzando i file di log del sito Web, è possibile scoprire le pagine visitate dagli altri utenti che a loro volta hanno visitato la stessa pagina nella quale l'utente corrente si trova. In particolare, si assume che in una sessione siano contenute le pagine necessarie per soddisfare il bisogno informativo dell’utente. In questo modo, le sessioni storiche possono svolgere il ruolo di “spazi di suggerimento”, in quanto includono pagine ritenute rilevanti nel medesimo “contesto”; 4)Struttura del sito web. La struttura di un sito web segue una tassonomia concettuale che viene sfruttata per la raccomandazione, suggerendo pagine web più specifiche o più generali di quella attuale. In particolare, si propongono i seguenti tre metodi diversi per effettuare raccomandazioni: 1)Nessuno storico: metodo baseline che considera la conoscenza lessicale/semantica delle pagine; 2)Storico dell’utente: considera oltre alle informazioni del metodo precedente quelle relative alle pagine che l'utente ha già visitato nella sessione corrente; 3)Storico collettivo: considera le stesse informazioni dei due metodi precedenti, nonché percorsi di navigazione considerati simili di precedenti visitatori del sito. Inoltre, per catturare l’importanza relativa delle pagine rispetto alla struttura del sito Web, per ognuna delle tecniche implementate è stato aggiunto un filtro con quattro diversi parametri che va a discriminare le pagine ottenute in output in base al numero di visualizzazioni (quindi l’importanza per il pubblico) oppure in base a tre diverse misure estrapolate dal grafo corrispondente al sito (Betweenness, Degree e Page Rank) che mettono in luce l’importanza “strutturale” delle pagine. La parte riguardante l’interfaccia di tale sistema di raccomandazione non è oggetto di questa tesi, tuttavia è auspicabile l’inserimento di un frame contenente i link suggeriti in una determinata area di ogni pagina Web contenuta nel sito o alternativamente in una finestra pop-up. La tecniche sono state testate sul sito Web del Comune di Modena (http://www.comune.modena.it), che contiene più di 13000 pagine ed è visitato da più di 120000 persone al mese.
|