Riassunto analitico
Il lavoro di tesi tratta l'Integrazione Dati provenienti da sorgenti eterogenee ed ha l'obiettivo dell'elaborazione di interrogazioni tramite fusione di dati "tradizionali" (database, file testuali, …) e "multimediali" (immagini, video, …).
La tesi si colloca nell'ambito del sistema di Integrazione Dati MOMIS (Mediator envirOnment for Multiple Information Sources), sviluppato dal DBGROUP dell'Università di Modena e Reggio Emilia e distribuito in versione open source da DataRiver, spin-off universitario presso il quale ho svolto il tirocinio.
Il Sistema MOMIS "tradizionale" è in grado di integrare dati provenienti da sorgenti tradizionali e di generare uno Schema Globale integrato rappresentativo di tali sorgenti. L'utente effettua quindi un'interrogazione sullo Schema Globale integrato, specificando criteri di ricerca, e riceve una risposta unificata ottenuta tramite fusione dei dati che provengono dalle varie sorgenti locali, fusione basata sostanzialmente su operazioni standard del linguaggio SQL.
Consideriamo ora una sorgente di dati "multimediali", quali ad esempio immagini, che consente la specifica delle cosiddette "Top-k query", in grado di restituire le immagini più simili (in base ad opportuni criteri di similarità) ad una data come riferimento.
Un Sistema di Integrazione tra dati tradizionale e multimediale deve essere in grado di costruire uno Schema Globale integrato rappresentativo sia delle sorgenti locali tradizionali che di quelle multimediali, e deve consentire all'utente di specificare interrogazioni che contengano congiuntamente sia criteri di ricerca tradizionali che criteri di ricerca per similarità sui dati multimediali. Il sistema deve essere quindi in grado di effettuare la fusione dei dati che provengono dalle sorgenti locali, sia tradizionali che multimediali per restituire all'utente una risposta unificata.
Nella presente tesi, dopo un'analisi delle soluzioni già presentate in letteratura, in particolare di quella precedentemente sviluppata nel contesto del Sistema MOMIS, viene sviluppata ed implementata una nuova soluzione per la fusione di dati tradizionali e multimediali, la cui caratteristica fondamentale è quella di utilizzare ancora solo operazioni standard del linguaggio SQL. In altri termini, nella soluzione proposta ed implementata i criteri di ricerca per similarità sono tutti gestiti dalla sorgente dati multimediali e la fusione con dati tradizionali avviene con un "SQL-engine" standard.
|