Riassunto analitico
L’enorme crescita dei dati dell’ultimo periodo ha portato con se, oltre alla possibilità di esplorare nuove frontiere per quanto riguarda l’analisi dei dati, difficoltà nella gestione di volumi sempre maggiori e di tipi di dato sempre più eterogenei, andando a mettere in discussione l’efficacia dei tradizionali Data Warehouse, portando alla nascita di nuove tecnologie e architetture. Questa tesi esplora le potenzialità del Data Lakehouse, andando ad analizzare il processo di migrazione da un Data Warehouse implementato su server on-premise ad un Data Lakehouse implementato su servizi cloud e andando a sfruttare Databricks come piattaforma unificata per la gestione dei dati. Inizieremo fornendo una panoramica sul mondo dell’analisi dati, su architetture già consolidate e sui motivi che hanno portato allo sviluppo di nuove architetture. Infine andremo ad analizzare un caso di studio di una migrazione da un Data Warehouse a un Data Lakehouse in una realtà aziendale già consolidata operante nel settore dell’e-commerce, soffermandoci sull’architettura scelta e le nuove modalità di trasformazione dei dati all’interno del Data Lakehouse.
|