Riassunto analitico
L’obiettivo principale del progetto di Dottorato era lo sviluppo e l’applicazione di nuovi strumenti chemiometrici per l’analisi esplorativa multivariata atti al trattamento di dati caratterizzati dall’assenza di chiari raggruppamenti o tendenze, anche quando proiettati su uno spazio di dimensioni minori. Questo tipo di dati possono essere complessi a tal punto che i normali strumenti di visualizzazione risultano poco efficaci nell’investigazione delle sulle strutture latenti. Sulla base di queste premesse è stato sviluppato l’approccio Fused Adjacency Matrix (matrice di adiacenza fusa), il che rappresenta il risultato principale del progetto. L’approccio è stato testato mediante un dataset di riferimento ottenuto da misurazioni spettroscopiche (visibile, vicino infrarosso e risonanza magnetica nucleare) su campioni di birra. Un'altra parte importante del progetto di Dottorato ha riguardato lo sviluppo di modelli per integrare dati da sorgenti di diversissima natura, come dati numerici e dati di testo, nel contesto della scienza degli alimenti. Gli strumenti della chimica analitica possono essere utilizzati sinergicamente con strumenti avanzati di analisi dei dati per la creazione di strumenti che siano al servizio del consumatore, per assisterlo nelle scelte alimentari, nell’appaiamento dei cibi, e allo stesso modo per aiutare i produttori a soddisfare le esigenze e i desideri dei clienti. In questa prospettiva è stato quindi sviluppato uno studio dei collegamenti tra il mondo “oggettivo” della chimica analitica e quello “soggettivo” del consumo e della valutazione degli alimenti, sulla base dei dati spettroscopici sulla birra già oggetto dello sviluppo di Fused Adjacency Matrix. Una serie di recensioni raccolte online è stata processata mediante metodi di analisi del testo e trasformata in formato numerico, idoneo per essere analizzato con metodi comuni di analisi del dato. Tale dato è stato poi collegato all’informazione spettrale mediante un metodo chiamato “principal component analysis–generalized canonical analysis” (PCA–GCA, analisi delle componenti principali–analisi canonica generalizzata), dal quale è stata ottenuta informazione utile a collegare le espressioni utilizzate per descrivere la birra ai composti chimici identificati mediante la spettroscopia.
|
Abstract
The main focus of this PhD project was on the development and application of new chemometric tools for multivariate exploratory analysis for dealing with data not showing simple groupings or trends, even when projected to spaces of lower dimensionality. Such data may be so complex that common visualizations tools are only shedding limited light on the underlying structures. Starting from these premises, the Fused Adjacency Matrix approach was developed as main outcome of the project. The approach was tested on a benchmark dataset of beer samples acquired using three spectroscopic techniques, namely visible, near-infrared and nuclear magnetic resonance spectroscopies.
Another important part of the PhD project concerned the extension of methods for integration of data sources of very different nature, like numerical and text data, within the food chemistry framework. As a matter of fact, analytical chemistry in synergy with advanced data analysis methods can be profitably used to build new tools to aid consumers to choose and pair foodstuff as well as producers to meet the consumers’ expectations and desires. In this perspective, an investigation of the links between the “objective” world of analytical chemical profiling and the “subjective” world of consumers tasting and describing food was carried out, in the context of beer analysis and consumption. By means of text analysis methods a set of user-generated reviews were processed and converted into a numeric format suitable for data analysis, and then linked by principal component analysis–generalized canonical analysis (PCA–GCA) to the spectral information provided by Visible, NIR and NMR spectroscopies.
|