Riassunto analitico
Nella tesi si parlerà della definizione, della struttura e dell'utilizzo di sistemi per l'integrazione dei dati. In particolare si analizzeranno il mappaggio tra Schema Globale e Schemi locali, i metodi di costruzione dello Schema Globale ed il querying dello stesso. Si parlerà in particolare del sistema di integrazione dei dati Momis nei dettagli: creazione e rifinitura dello Schema Globale, funzioni di risoluzione dei conflitti, operatore di full outer join con merge, dettagli sull'interrogazione e trend. Si parlerà in oltre di Flink: cosa è Flink e come è strutturato internalmente, come è organizzato il codice e come utilizzarlo per usufruire degli operatori messi a disposizione, come Flink gestisce internalmente i dati e come inizializzare il framework Flink. Si parlerà di Docker: cos'è Docker, a cosa serve, come è strutturato, come lo si utilizza per creare macchine virtuali e quali sono i vari servizzi messi a disposizione all'utente. Si parlerà di come costruire un cluster Flink tramite Docker. Si parlerà di come implementare un full outer join ad più vie tramite Flink per l'utilizzo in Momis: limiti attuali, idea di base, implementazione di base, rifinimento ulteriore.
|