Riassunto analitico
La prognosi del cancro è un aspetto estremamente importante nell'ambito sanitario, dove stime precise del rateo di sopravvivenza di un paziente impattano significativamente sulle strategie terapeutiche e i risultati clinici. Sfruttando dati omici, come l'espressione genica, la variazione del numero di copie e i profili di metilazione, è possibile ottenere una visione biologica più completa, contribuento così al miglioramento dei modelli prognostici. Questa tesi introduce un innovativo framework di integrazione multi-omica che impiega reti neurali a grafi per prevedere il rateo di sopravvivenza globale di pazienti oncologici affetti da diversi tipi di tumore. L'architettura sviluppata presenta diversi elementi proposti, tra cui un layer convoluzionale a grafo capace di estrarre features di alto livello pur preservando le proprietà di interpretabilità, una struttura eterogenea a grafi che integra diversi tipi di dati omici per rappresentare le relazioni biologiche tra essi, ed una pipeline di interpretabilità progettata per estrarre informazioni biologiche nuove e rilevanti, come biomarcatori o vie metaboliche, tramite visualizzazioni interattive. Il modello proposto migliora sia l’interpretabilità sia l’accuratezza predittiva rispetto ai metodi dello stato dell'arte. Le prestazioni del framework sono state valutate sia su dataset pubblici provenienti dal TCGA, sia su dataset privati specializzati sul cancro ovarico, in collaborazione con il progetto Europeo DECIDER. I risultati ottenuti evidenziano il potenziale di questo approccio per migliorare la stima del rateo di sopravvivenza in oncologia, offrendo una maggiore accuratezza predittiva ed estraendo informazioni preziose da dati complessi e multidimensionali.
|
Abstract
Cancer prognosis is a pivotal aspect of healthcare, where precise predictions of patient survival significantly impact treatment strategies and outcomes. By leveraging omics data, such as gene expression, copy number variation, and methylation profiles, researchers can obtain a comprehensive biological perspective that contribute to the enhancement of prognostic models.
This thesis introduces an innovative multi-omic integration framework that employs graph neural networks to predict the overall survival of cancer patients across various tumour types. The proposed architecture features several novel elements, including a new graph convolutional layer capable of extracting high-level features while retaining explainability properties, a heterogeneous graph structure that integrates multiple omics data types to represent the biological relationships among them, and an explainability pipeline designed to uncover relevant biological information, such as new biomarkers or pathways, through interactive visualization. The proposed model improves both interpretability and predictive accuracy compared to current state-of-the-art methods.
The framework's performances were evaluated using both public TCGA datasets and a private cohort specialized in ovarian cancer study, in collaboration with the DECIDER European project. The findings highlight its potential to enhance survival analysis in oncology by delivering improved accuracy and extracting valuable insights from complex, multidimensional data.
|