Riassunto analitico
Questo elaborato nasce dal progetto a cui ho partecipato durante il periodo di stage presso l’azienda SMC Consulting s.r.l. di Carpi (MO) che opera nell’ambito dell’e-commerce. Oggetto di questo elaborato è la Business Intelligence, un aspetto fondamentale all’interno delle aziende nei processi decisionali, tanto più oggi che i dati in formato elettronico crescono esponenzialmente in tutti i settori ed impattano su ogni attività e su ciascuno di noi. L’analisi e l’elaborazione delle informazioni, al fine di prendere decisioni strategiche, è sempre più una fase importante e decisiva per le aziende che vogliono crescere all’interno del proprio mercato. Il progetto ha l’obiettivo di progettare e sviluppare un data warehouse da integrare all’interno della piattaforma di sviluppo Intershop, utilizzata dall’azienda per la creazione di applicazioni di commercio elettronico, e successivamente analizzarne i dati per fornire statistiche e report. Le sorgenti dati utilizzate per l’integrazione sono il database relazionale e i dati provenienti dagli accessi web (memorizzati da Apache) e dalle ricerche effettuate dagli utenti nei siti web (memorizzate da Solr), presenti nella piattaforma di Intershop. La fase di progettazione concettuale del data warehouse è dunque iniziata con l’osservazione dei dati a disposizione del progetto e presenti nel database di Intershop, focalizzandosi sull’analisi delle dimensioni di interesse, quali i prodotti venduti, i clienti, i pagamenti ecc… Successivamente sono passato alla fase di progettazione logica definendo il modello dello starschema del data warehouse e alla sua alimentazione, tramite il tool ETL Talend, permettendomi di pulire e filtrare i dati grezzi, in modo da essere integrati assieme nel data warehouse. Ho quindi creato e automatizzato il processo di popolamento del data warehouse con nuovi dati, in maniera periodica ed incrementale, su server remoti. L’ultima fase ha riguardato l’analisi dei dati, ed è stata condotta con uno degli strumenti di Business Intelligence leader di mercato, Microsoft PowerBI, per la creazione di report statistici, al fine di supportare il processo decisionale.
|
Abstract
This work is based on the project I attended during the stage at SMC Consulting s.r.l. of Carpi (MO), which operates in the field of e-commerce.
The object of this paper is Business Intelligence, a fundamental aspect of companies in decision-making, in particular when electronic data grows exponentially in all sectors and impact on each activity.
Analyzing and processing information in order to make strategic decisions is increasingly an important and decisive step for companies that want to grow within their own market.
The project aims to design and develop a data warehouse to integrate into the Intershop development platform, used by the company to create e-commerce applications, and then analyze data to provide statistics and reports.
The data sources used for integration are the relational database and data from the web accesses (stored by Apache) and the searches made by the users on the websites (stored by Solr), present in the Intershop platform.
The conceptual design phase of the data warehouse has thus begun by considering the data available to the project and present in the Intershop database focusing on analysis of the interest dimensions such as sold products, customers, payments etc ...
The next step was the logical design stage by defining the data warehouse's starschema model and its alimentation, using the Talend ETL tool, allowing to clean and filter the raw data so that they can be integrated together in the data warehouse. Then an automatic process for populating the data warehouse with new data was realized, which periodically and incrementally update data on remote servers.
The last phase involved data analysis, and was conducted with one of the market leading Business Intelligence tool, i.e., Microsoft PowerBI, for creating statistical reports to support decision-making.
|