Riassunto analitico
Il presente lavoro di tesi, maturato durante un'esperienza di tirocinio per tesi presso una società di consulenza informatica, mira a presentare una soluzione di Business Intelligence che è stata oggetto di migrazione e re-ingegnerizzazione dal punto di vista informativo, per una nota compagnia del settore manifatturiero. Il processo di migrazione è stato così definito: passaggio da un Data warehouse del vendor IBM, ovvero IBM Netezza ad un Data warehouse più stabile e performante, ovvero SAP DB HANA. A causa del divario tecnologico con IBM Netezza, si è reso necessario riprodurre a partire dall'analisi dell'intero ciclo di vita dei fatti, ovvero consegne, fatture e ordini (modulo di SAP SD: Sales and Distribution), delle tabelle sorgente dunque, della staging area e delle tabelle target, la medesima certificazione del dato che avveniva precedentemente fino a Gennaio 2020, mese di migrazione completa. La mole di dati gestita nella soluzione ha reso necessaria anche la re-ingegnerizzazione del processo di ETL, gestito tramite un altro componente della suite SAP di Business Intelligence, ovvero SAP Data Services, utilizzato quotidianamente e in modalità batch processing per gestire in autonomia i caricamenti del dato da diverse fonti esterne al Data warehouse finale. Il lavoro di tesi continua presentando un ulteriore tool di SAP, ovvero l'Information Design Tool, o IDT, un ambiente di progettazione di metadati di SAP Business Objects che consente di estrarre, definire e manipolare i metadati delle origini relazionali e OLAP per creare e distribuire universi SAP. Questo tool rende infine possibile la definizione, con tool di Data visualization come SAP BO Web Intelligence, utilizzato proprio durante il progetto di tesi, la creazione di diversi report istituzionali attraverso i quali verificare che la certificazione del dato tra sorgente e target sia coerente. Il lavoro di tesi infine termina presentando vantaggi e svantaggi di un tale approccio relazionale, presentando una chiave di lettura diversa come quella non-relazionale che potrebbe un domani rimpiazzare completamente i classici Data warehouse con i più moderni Data lake, soprattutto in ambito manifatturiero, in seguito alla natura eterogenea dei dati di cui disponiamo.
|
Abstract
This master’s thesis work, matured during a thesis internship experience at an IT consulting company, aims to present a Business Intelligence solution that has been migrated and re-engineered from an informative perspective, for a well-known company of the manufacturing sector. The migration process was defined as follows: transition from Data warehouse of the vendor IBM, that is IBM Netezza to a much more stable and performing Data warehouse solution, which is SAP DB HANA. Due to the technological gap with IBM Netezza, it was necessary to reproduce, starting from the analysis of the entire life cycle, facts like deliveries, invoices and orders (SAP’s module SD: Sales and Distribution), source tables, staging area and target tables, the same certification of the data that took place previously until January 2020, the month of complete migration. The amount of data managed in the solution also made it necessary to re-engineer the ETL process, managed through another component of the SAP Business Intelligence suite, which is SAP Data Services, used daily and in batch processing mode to manage autonomously data uploadings from various external sources to the final Data warehouse. The master’s thesis work continues by presenting an additional SAP tool, which is the Information Design Tool, or IDT, a SAP Business Objects metadata design environment that allows us to extract, define and manipulate the metadata of relational and OLAP sources to create and distribute SAP universes. This tool in the end makes it possible the definition, with Data visualization tools such as SAP BO Web Intelligence, used during this project, of different institutional reports through which verify that the certification of data between source and target is consistent. The thesis work ends by presenting the advantages and disadvantages of such a relational approach, presenting a different interpretation such as the non-relational one that could one day completely replace the classic Data Warehouses with the more modern Data lakes, especially in the manufacturing sector, due to the heterogeneous nature of the data we have.
|