Riassunto analitico
La tesi verte su un progetto di tirocinio relativo allo studio sui consumi di energia e gas di un’azienda metallurgica del Nord Italia.
La tesi è divisa in tre sezioni. Nella prima parte sono descritte e analizzate alcune tecniche per la costruzione di modelli di regressione che rientrano nell’ambito del Machine Learning. Dopo aver mostrato che il processo di apprendimento automatico si può ricondurre alla risoluzione di un problema di ottimizzazione, viene definito lo schema da seguire nella costruzione di un modello di learning, con particolare attenzione per alcune tecniche utilizzate nel progetto: dummy coding, normalizzazione e standardizzazione dei dati, cross validation e regolarizzazione. Successivamente, si analizzano approfonditamente due algoritmi: il metodo lasso e il metodo Support Vector Machine (SVM).
La seconda parte della tesi si occupa del problema del consumo energetico. Dopo l’analisi statistica dei dati, per ognuno dei tre stabilimenti dell’azienda sono selezionate le features più significative, al fine di costruire un modello previsionale utilizzando le tecniche di machine learning citate in precedenza. Successivamente, i tre modelli vengono uniti in un solo modello, senza che questo porti a un netto peggioramento della performance.
La terza ed ultima parte della tesi si occupa del consumo di gas di uno degli stabilimenti dell’azienda. In questo caso, dall'analisi statistica scaturisce che il consumo dipende principalmente dalla temperatura esterna. Di conseguenza, sono stati implementati due modelli di learning: uno per la temperatura, e uno per il consumo di gas.
|