Riassunto analitico
In un'era in cui le decisioni basate sui dati rivestono un ruolo sempre più centrale, la capacità di analizzare e prevedere pattern in dataset complessi è fondamentale. Questa tesi si concentra sull'integrazione di tecniche avanzate di analisi dei dati e modelli predittivi per rispondere alle sfide poste dalle serie temporali multivariate. Utilizzando dati reali sul funzionamento delle turbine eoliche come caso di studio, questa ricerca esplora come il rilevamento di anomalie, la riduzione della dimensionalità e i metodi di previsione possano essere integrati per affrontare efficacemente l'analisi delle serie temporali multivariate. Per gestire l'elevata dimensionalità dei dati di serie temporali non stazionarie, applichiamo la Moving Dynamic Principal Component Analysis (MDPCA), una tecnica progettata per mantenere le principali relazioni dinamiche riducendo al contempo la complessità e la dimensionalità dei dati. I dati anomali vengono identificati utilizzando metodi di visualizzazione e una tecnica basata sulla prossimità nota come algoritmo Local Outlier Factor (LOF), che rileva anomalie sia globali che locali. Infine, applichiamo un modello Auto ARIMA per prevedere la potenza prodotta dalla turbina eolica. Questo elaborato evidenzia come l'integrazione di strumenti di analisi avanzati e modelli predittivi possa fornire soluzioni efficaci nello studio di dati reali. I risultati mostrano che migliorare la qualità dei dati attraverso la riduzione della dimensionalità e il rilevamento delle anomalie è essenziale per costruire previsioni accurate e affidabili, rendendo questo approccio applicabile a numerosi altri settori oltre a quello delle turbine eoliche.
|
Abstract
In an era where data-driven decision-making is crucial, the ability to analyze and predict patterns in complex datasets is essential.
This study focuses on integrating advanced data analysis techniques and predictive modeling to address challenges in multivariate time series data. Using real-world data from wind turbine operations as a case study, we explore how outlier detection, dimensionality reduction, and forecasting methods can create a robust workflow for analyzing multivariate time series data.
To manage the high dimensionality of non-stationary time series data, we apply the Moving Dynamic Principal Component Analysis (MDPCA), a technique designed to retain key dynamic relationships while reducing complexity and data dimensionality.
Anomalous data are identified using visualization methods and a proximity-based technique known as the Local Outlier Factor (LOF) algorithm, which identifies both global and local outliers. Finally, we apply an Auto ARIMA model to forecast the wind turbine’s power output.
This study demonstrates that combining advanced analysis tools with predictive models can effectively address real-world data challenges. The results show that improving data quality through dimensionality reduction and outlier detection is essential for building accurate and reliable forecasts, with applications extending beyond the wind turbine case to many other fields.
|