Riassunto analitico
Questa tesi si concentra sulla sfida crescente dell’elaborazione e gestione di grandi quantità di dati nelle organizzazioni. In particolare, esamina il processo Extract, Transform, Load (ETL), utilizzato per trasformare e integrare dati da diverse fonti in un formato comune per supportare l’analisi e la presa di decisioni informate. Un compito fondamentale del processo ETL è la trasformazione di dati XML in documenti HTML, spesso realizzata utilizzando XSLT. Tuttavia, l’elaborazione di grandi quantità di dati XML e la loro trasformazione in HTML può richiedere tempo e risorse significative, e l’archiviazione dei risultati può rappresentare un ulteriore ostacolo. L’obiettivo di questa tesi è studiare e implementare tecniche di ottimizzazione per migliorare l’efficienza del processo ETL di trasformazione di dati XML in HTML tramite XSLT e affrontare le problematiche legate all’archiviazione dei risultati. Attraverso l’analisi della letteratura esistente e l’implementazione di soluzioni innovative, questa ricerca mira a fornire un contributo significativo nel campo dell’ottimizzazione dei processi ETL e della gestione efficiente dei dati.
|
Abstract
This thesis focuses on the growing challenge of processing and managing large amounts of data in organizations. In particular, it examines the Extract, Transform, Load (ETL) process, used to transform and integrate data from different sources into a common format to support analysis and informed decision-making. A fundamental task of the ETL process is the transformation of XML data into HTML documents, often carried out using XSLT. However, processing large amounts of XML data and their transformation into HTML can require significant time and resources, and storing the results can represent a further obstacle.
The aim of this thesis is to study and implement optimization techniques to improve the efficiency of the ETL process of transforming XML data into HTML via XSLT and to address the issues related to storing the results. Through the analysis of existing literature and the implementation of innovative solutions, this research aims to provide a significant contribution in the field of ETL process optimization and efficient data management.
|