Riassunto analitico
I linfomi maligni sono un gruppo eterogeneo e complesso di tumori del sistema immunitario. La normale procedura medica per il loro trattamento inizia con la valutazione dell’estensione di malattia attraverso esami total body con tomografia computerizzata (TC), risonanza magnetica (RM) e tomografia a emissione di positroni (PET). Sebbene questi siano il mezzo principale per valutarne visivamente l’entità, non vengono utilizzati a fine diagnostico. Attualmente, l’unico metodo disponibile per identificare il tipo di linfoma è attraverso il campionamento di un singolo sito tumorale tramite biopsia. L’ipotesi sulla quale si concentra questa tesi è che potrebbe essere possibile predire la diagnosi differenziale di quattro principali sottotipi di linfoma (diffusi a grandi cellule, follicolari, Hodgkin e mantellari) utilizzando un approccio basato sui dati. Attraverso la texture analisi delle immagini diagnostiche di routine è possibile, infatti, calcolare per ogni lesione (o VOI) dei valori numerici, chiamati feature, che ne descrivono le caratteristiche. L’obiettivo della tesi è quello di applicare e valutare algoritmi di machine learning sulle feature estratte dai VOI di 36 pazienti dell’Arcispedale Santa Maria Nuova di Reggio Emilia, di cui si conosce, per via istologica, la tipizzazione del sottotipo, con lo scopo di associare l’output corretto (il sottotipo di linfoma) ai dati provenienti dalla texture analisi. Inoltre, poiché la diagnosi si riferisce al paziente e non alla singola lesione e ogni paziente può presentare diverse lesioni, un’analisi di questo tipo si configura come un problema di Multiple Instance Learning (MIL). In base ai risultati ottenuti, si vuole, in primo luogo, valutare quale metodo fornisce i risultati migliori e, in secondo luogo, valutare la fattibilità di utilizzare questi modelli per supportare la diagnosi dei sottotipi in dataset più grandi.
|
Abstract
Malignant lymphomas are a heterogeneous group of tumours of the immune system that can be divided into four main subtypes: Diffuse Large B-Cell, Follicular, Hodgkin, and Mantle Cell. The usual medical procedure to deal with them starts with the identification of their location and staging through full-body scans, like Computed Tomography (CT), Magnetic Resonance Imaging (MRI) and Positron Emission Tomography (PET). Although these are the primary means to visually assess the lymphoma’s overall gravity, they are not employed to identify the type of lymphoma. Today, the only available method to identify them is through biopsy.
The purpose of this thesis is to argue that it could be possible to predict the type of lymphoma by using a data-driven approach. Starting from the diagnostic routine images taken from full-body scans, it is possible to use texture analysis to extract some features from each volume of interest (VOI) i.e. lesion. The features are statistical and mathematical calculations that describe each particular VOI. By employing machine learning algorithms on the features extracted from 349 VOIs of 36 patients from the Arcispedale Santa Maria Nuova of Reggio Emilia, a function is learnt from data, that associates the correct output (the lymphoma subtype) to the given input (features from texture analysis of the VOIs). Furthermore, because the diagnosis refers to the patient and not to the single VOI and each patient can have several tumours, the analysis entails a Multiple Instance Learning problem (MIL) that needs to be addressed. Finally, by comparing the results, I evaluate first which MIL framework provides the most valid results and second the feasibility of using a machine learning approach in larger datasets.
|