Riassunto analitico
La scarsità di dati etichettati e la necessità di metodi di apprendimento più flessibili e scalabili sono diventati problemi particolarmente evidenti nell'intelligenza artificiale. I dati etichettati, ampiamente utilizzati nei contesti di apprendimento supervisionato, sono spesso difficili da ottenere in quantità sufficienti per addestrare efficacemente un modello. Inoltre, l'annotazione manuale dei dati può risultare particolarmente costosa in termini di tempo e risorse ed è soggetta a errori umani, che possono compromettere la qualità degli stessi. In risposta a queste sfide, è emerso il Self-Supervised Learning (SSL): una tecnica di apprendimento non supervisionato che consente ai modelli di apprendere rappresentazioni significative dei dati senza la necessità di etichette predefinite, sfruttando le relazioni intrinseche presenti nei dati stessi. Pertanto, l'SSL si presenta come una soluzione robusta e versatile, in grado di migliorare l'efficienza, l'efficacia e la scalabilità dei modelli di apprendimento automatico, ampliando le possibilità di utilizzo di grandi volumi di dati disponibili. L'uso delle tecniche di apprendimento self-supervised (SSL) è cruciale per la previsione delle serie temporali, soprattutto in domini come la finanza, la medicina e i prezzi dell'elettricità, dove l'acquisizione di dati etichettati è costosa e richiede molto lavoro. In questi scenari, i metodi SSL possono ridurre significativamente la dipendenza dai dati etichettati, consentendo soluzioni di previsione più efficienti e scalabili. Purtroppo, le tecniche SSL state-of-the-art non hanno ancora raggiunto miglioramenti in termini di efficacia paragonabili a quelli ottenuti con i modelli supervisionati. Per colmare questa lacuna, la tesi propone una pipeline che può essere abbinata a un modello SSL generico per la previsione delle serie temporali e che porta a un miglioramento delle prestazioni. Basandosi sul successo dei modelli supervisionati, questa pipeline esplora la decomposizione delle serie temporali in componenti di trend ed errore. Il lavoro dimostra che questa decomposizione consente a un modello di previsione generico di migliorare significativamente la sua accuratezza.
|
Abstract
The scarcity of labeled data and the need for more flexible and scalable learning methods have become particularly evident issues in artificial intelligence. Labeled data, widely used in supervised learning contexts, are often difficult to obtain in sufficient quantities to effectively train a model. Additionally, manual data annotation can be particularly expensive in terms of time and resources and is prone to human error, which can compromise data quality. In response to these challenges, Self-Supervised Learning (SSL) has emerged: an unsupervised learning technique that allows models to learn meaningful data representations without the need for predefined labels, leveraging the intrinsic relationships present within the data itself. Therefore, SSL presents itself as a robust and versatile solution capable of improving the efficiency, effectiveness, and scalability of machine learning models, expanding the possibilities for utilizing large volumes of available data.
The use of self-supervised learning (SSL) techniques is crucial for time series forecasting, especially in domains like finance, medicine, and electricity pricing, where acquiring labeled data is costly and labor-intensive. In these scenarios, SSL methods can significantly reduce the reliance on labeled data, enabling more efficient and scalable forecasting solutions. Unfortunately, state-of-the-art SSL techniques have not yet achieved improvement in terms of effectiveness comparable to those obtained with supervised models.
To bridge this gap, the thesis proposes a pipeline that can be coupled with a generic SSL model for time series forecasting and leads to performance improvement. Building on the success of supervised models, this pipeline explores the decomposition of time series into trend and error components. The work demonstrates that this decomposition enables a generic forecasting model to significantly improve its accuracy.
|