Riassunto analitico
Sommario
L’incredibile evoluzione tecnologia che abbiamo vissuto negli ultimi 20-30 anni, ha avuto come una delle sue conseguenze la generazione di un enorme flusso di dati. Centinaia di sensori dei più svariati tipi monitorano costantemente la produzione e questa condizione è comune ai campi più disparati. Il settore chimico e quello petrolchimico, su quest’ultimo verte il mio dottorato, possono trarre molti vantaggi da questa innovazione e questo spiega perché le aziende hanno investito grandi capitali nelle strumentazioni di controllo processo e nella gestione dei dati. Al contempo gli strumenti di statistica classica, normalmente impiegati nel controllo di processo, non erano sufficienti e adatti alla gestione di un crescente numero di sensori, di integrare tra loro i differenti dati e di convertire tutto ciò in informazioni utili. Perciò sono stati sviluppati nuovi strumenti, molti dei quali sono compresi nelle tecniche di analisi multivariata dei dati (MVDA). Queste includono le tecniche di decomposizione che permettono la compressione dei dati e spostano l’attenzione dall’andamento nel tempo della singola variabile alla struttura di correlazione dei dati, in altre parole mostrano la struttura dei dati nel complesso; questo è il principale vantaggio dell’approccio multivariato. Un’altra caratteristica relativa alla MVDA, anch’essa di fondamentale importanza, è quella di generare limiti di confidenza basati sulla variazione del sistema e non sul valore di ogni sensore d’impianto. Le tecniche multivariate tengono conto della fondamentale correlazione che esiste tra le variabili. Nonostante l’enorme miglioramento degli algoritmi per quanto concerne l’efficienza di calcolo, la facilità d’uso e l’applicabilità, l’analisi multivariata non è largamente applicata in industria, malgrado l’evoluzione di hardware e software permetta calcoli in tempi ragionevoli, spesso in tempo reale. Questo può essere dovuto ad un lacuna culturale che questa tesi cerca di affrontare, quantomeno in relazione al contesto dove è stata applicata. La natura dei processi nel settore petrolchimico e l’abbondante numero di sensori restituiscono dati fortemente correlati, caratterizzati da rumore non trascurabile e con considerevoli percentuali di missing data. In questo modo l’informazione disponibile è spesso celata e non viene individuata con tecniche classiche basate su un approccio univariato. Inoltre l’industria petrolchimica risente di problematiche legate alle variazioni dei prodotti, dei carichi di impianto, dell’invecchiamento e dello sporcamento delle linee produttive, aspetti che rendono ancora di più le tecniche multivariate adatte al monitoraggio del processo stesso. I database storici sono ormai presenti in molte realtà industriali e mi hanno permesso di esplorare alcune delle principali problematiche che si possono trovare. Il progetto di dottorato, svolto in collaborazione con Versalis-eni attingendo ai loro database, prende in considerazione i seguenti tre punti: - Monitoraggio di una produzione batch
- Monitoraggio della qualità del prodotto in una produzione in continuo
- Individuazione delle cause di un problema
Queste problematiche hanno caratteristiche fortemente diverse sia in termini di strutture dati che in relazione alle metodologie di analisi applicate. Il dottorato di ricerca da me sostenuto in questi tre anni vuole mostrare come l’analisi multivariata dei dati possa essere uno strumento di rilevante importanza nel contesto petrolchimico in particolare, e in tutti i contesti nei quali le strutture dati hanno le medesime caratteristiche: alta correlazione, elevato rumore e presenza di dati mancati
|
Abstract
Abstract
The impressive technological innovation taking place in the last decades among others consequences has brought to the generation of a huge amount of data. Nowadays, hundreds of sensors constantly monitor production, belonging to many different kinds, and this condition is common to various fields: from the agricultural to the refining, from food to the waste treatment industry. The chemical and petrochemical industries, that concern my PhD, have most to gain from this innovations and this explain why companies invest large sums of capital in process control and data management. At the same time, the classic statistics tools employed in process control were not sufficient/efficient to meet the emerging challenges of managing a growing number of diverse sensors, integrating their data and convert it to information. Thus, new tools are being developed, most of which belong to the multivariate data analysis (MVDA) techniques. These include decomposition techniques that allow data compression and shift the analysis focus from the time trends of individual variables to the correlation pattern of the whole data, in other words focusing on and revealing data structure; this is the main advantage of multivariate approach. Another MVDA feature, one of fundamental importance, is to generate confidence limits related to the whole system variance and not linked on a single variable. Multivariate techniques take into account the fundamental correlation that exists between the variables. Notwithstanding the enormous improvement of multivariate algorithms with respect to calculation efficiency, ease of use and portability, the multivariate data analysis is not widespread applied in the industry in despite of hardware and software evolution that allow calculation in a reasonable time and most often in real time. This could be mainly due to a cultural gap and this thesis tried to afford it, at least in the specific working context where it has been developed.
The abundance of sensors and the chemical process features return data matrix with strongly correlated variables, a significant noise amount and a considerable percentage of missing data. Moreover, petrochemical lines suffer a lot of different effects: flow rate variation, items aging and fouling factor; this characteristics make multivariate data analysis even more adapt to process monitoring.
The Versalis company which is a partner in this thesis project, has historical database that made possible to me tackling some of the main problematic related to polymer production. PhD project take into account the three following issues: - Batch production monitoring
- Quality parameter monitoring in a continuous production - Trouble shooting analysis
These tasks differ for data structure and in relation to the applied multivariate methods. Each issue has its own peculiarities. My PhD study, along the three past years, proofs the importance of multivariate data analysis and multivariate process monitoring in petrochemical environment and in the other context in which data suffers the same problems: correlation, noise and missing data.
|