Riassunto analitico
I progressi nella progettazione della strumentazione analitica, in special modo per le tecniche ifenate, hanno portato a una crescente necessità di analizzare dati con una struttura multi-way, dove ciascun campione è rappresentato da un landscape a due dimensioni (es. cromatografia/spettrometria di massa, eccitazione/ emissione in fluorescenza). Da qui nasce il bisogno di strumenti di analisi dati, in grado di trattare queste strutture complesse. La questione diventa poi di fondamentale importanza nell’analisi alimentare, dove le certificazioni di qualità e autenticità oggi sono un obbligo sia dal punto di vista del consumatore che del produttore. Diventa chiaramente necessario migliorare le metodiche analitiche in termini di efficienza robustezza e rapidità, ed accoppiarle all’analisi multivariata dei dati per selezionare l’effettiva informazione. Il mio progetto di tesi esplora due strumenti chemiometrici che operano sui dati multi-way: Multivariate Curve Resolution (MCR) e i metodi di classificazione per array a tre dimensioni (o superiori). Inoltre vengono studiati due campi di applicazione: la risoluzione e quantificazione dei costituenti alimentari, attraverso il così detto ‘approccio matematico alla cromatografia’, dove i picchi sono risolti a posteriori utilizzando MCR, il che permette di risolvere problemi di coeluzione; e la costruzione di modelli di autenticazione per riconoscere prodotti identificati dalla denominazione di origine protetta (DOP). Per questo scopo metodi discriminanti multi-way (NPLS-DA) e multiset (MCR discriminante), così come modellamento di classe multi-way (N-SIMCA) sono applicati confrontandoli rispetto all’attuale stato dell’arte. I casi studiati derivano da applicazioni per tecniche ifenate, qui utilizzate come metodo di fingerprinting, in particolare, tre diverse denominazioni di vino Lambrusco DOP sono state per la prima volta caratterizzate rispetto alla frazione di composti fenolici (HPLC-DAD). Altri dataset di precedenti lavori del nostro gruppo o della letteratura riguardano Olio Extra Vergine di Oliva Ligure DOP e vini di differente provenienza geografica (entrambi caratterizzati tramite HS-SPME/GC-MS). Gli aspetti salienti delle applicazioni MCR, del lavoro di ricerca, sono stati l’uso di alcuni vincoli come il rango locale o la selettività, fondamentali per la corretta risoluzione e quantificazione dei composti d’interesse. Per la classificazione, lo studio si è concentrato sulla versione a n dimensioni del metodo SIMCA (Soft Independent Modeling of Class Analogies), di recente sviluppo, N-SIMCA. L’obiettivo era di dimostrare quali sono i vantaggi e svantaggi di una tecnica di modellamento di classe rispetto a un approccio discriminante e della classificazione multi-way rispetto a quella 2-way sugli stessi dati srotolati o sugli scores ottenuti da un metodo di decomposizione come PARAFAC o Tucker3. Si è dimostrato che l’analisi multi-way rappresenta una valida strategia per i casi di autenticazione e classificazione, fornendo alti valori di sensibilità e specificità per tutti i modelli calcolati; le tecniche di modellamento di classe rispetto agli approcci discriminanti sono meno performanti nel caso in cui ci sia una forte eterogeneità all’interno della classe. Inoltre è descritto e proposto un nuovo metodo di classificazione discriminante, basato su una regressione attraverso MCR. Il metodo è basato sul fornire l’informazione riguardante la classe attraverso un vincolo di selettività. I principali vantaggi riguardano i profili di concentrazioni risultanti (matrice degli spettri) che forniscono un’interessante interpretazione delle caratteristiche del modello.
|
Abstract
The progress in design of analytical instrumentations, especially hyphenated techniques, has rapidly increased the need to analyze data, which have a multi-way structure, i.e. each sample is characterized by a 2D landscape (e.g. chromatography/mass spectrometry, excitation/emission fluorescence). Hence the need of data analysis tools capable of handling this complex data structure. This issue is topical in food analysis, dealing with quality and authentication assessment, nowadays mandatory both from producers and consumers points of view. From here the necessity of improving analytical methods, in terms of efficiency, robustness and rapidity, and coupling them with multivariate data analysis to effectively extract information. My thesis project explored two chemometrics tools handling multi-way data: Multivariate Curve Resolution (MCR) and Multi-way classification methods. As well as two application fields are investigated: resolution and quantification of food constituents, by the so called Mathematical chromatography approach, where peaks are resolved ‘a posteriori’ (using MCR), which allows handling strong co-elution issues; and building authenticity models to recognize typical products label by protected denomination of origin (PDO). To this aim multi-way (NPLS-DA) and multiset (discriminant-MCR) discriminant methods as well as multi-way class modeling (N-SIMCA) were comparatively applied and discussed with respect to the current state of art methodology. Case studied derived from hyphenated techniques, here used as fingerprinting methods, in particular PDO Lambrusco wine of three different denomination were for the first time characterized (HPLC-DAD) with respect to the phenolic fraction. Additional data sets, from previous work of our group or from literature regards PDO Ligurian Extra Virgin Olive Oil and wines of different geographical for the identification of provenience characterized by (HS-SPME/GC-MS).
In the MCR application salient aspects dealt within the research work have been the use of local rank and selectivity constraints, that had been crucial for the correct resolution and quantification of target compound.
Regarding classification, the study focuses on the n-dimensional version of the SIMCA (Soft Independent Modeling of Class Analogies) methodology, recently developed, N-SIMCA. Here focus was on demonstrating advantages/disadvantages of class modeling with respect to discriminant approaches and of multi-way classification with respect to classical 2-way classification performed on unfolded data or on scores from decomposition methods, such us PARAFAC or Tucker3.
This part demonstrates that multi-way data analysis can represent a powerful strategy in authentication and classification tasks giving high values of sensitivity and specificity for all the model calculated; class modeling techniques respect to discriminant one results suboptimal in case of strong intra-class heterogeneity.
Furthermore, a new classification approach based on extension of MCR based regression to discrimination task is also proposed. Basically, it works including class information as an additional selectivity constraint. Main advantages is that, the while resulting MCR concentration profiles can be interpreted as classical samples scores, the recovered component profiles (spectral matrix) provides a very interesting interpretation of the characteristic of the modeled classes in terms of spectral signature which are class specific.
|