Riassunto analitico
La diagnosi cutanea è spesso basata sulle immagini; la qualità delle immagini ottenute e le informazioni che se ne possono ricavare sono fondamentali in questa pratica. Le tecnologie di imaging per la previsione del rischio stanno tuttavia cambiando il panorama della dermatologia e sembrano avere un grande potenziale per migliorare lo screening del cancro della pelle. I dispositivi automatizzati basati sull'intelligenza artificiale (AI) possono essere un valido strumento di supporto per i dermatologi. L'utilizzo di reti neurali convoluzionali di apprendimento profondo (CNN) per la valutazione del rischio di malignità può cambiare la pratica diagnostica classica. Il mio lavoro di tesi è stato svolto all'interno dell'azienda Canfield Scientific, leader mondiale nei sistemi di dermatologia medica. Una delle sfide di Canfield è quella di migliorare la diagnosi assistita da computer basata sul proprio sistema CNN chiamato DEXI. DEXI (Dermoscopy Explained Intelligence) 2.0 è la più recente AI di Canfield, che attraverso l'uso della dermatoscopia a epiluminescenza e l'analisi delle immagini in deep learning produce informazioni sulla classificazione delle lesioni e sul rischio di malignità. DEXI 2.0 è stato recentemente addestrato con varie strategie e diverse opzioni di addestramento. Lo scopo del presente studio è quello di indagare, attraverso uno studio retrospettivo multicentrico, le prestazioni diagnostiche della versione DEXI 2.0 in un contesto di cliniche italiane. È stato messo a confronto il risultato prodotto da DEXI con quello prodotto dall'analisi istopatologica della lesione. Le nuove norme richiedono a Canfield di generare dati clinici sulla sicurezza e sulle prestazioni dei propri dispositivi. Il secondo scopo dello studio è quindi quello di generare dati clinici. In entrambi i casi è stata testata la capacità dell'algoritmo di riconoscere le otto categorie ISIC (The International Skin Imaging Collaboration) 2019. Questo lavoro rappresenta uno studio pilota italiano molto utile per successivi studi. Le immagini dermoscopiche di lesioni cutanee sono state ottenute da cliniche italiane attraverso i sistemi VIDIX 4.0 e VTRACK 4.0. È stato creato un dataset per collezionare e mettere in relazione metadati e immagini delle lesioni. Le immagini sono state analizzate attraverso il sistema di AI e i dati sono stati rielaborati mediante metodi statistici. Nel presente studio son stati inclusi 141 pazienti (48,9 % femmine e 51,1 % maschi). Il dataset creato contiene una collezione di 172 lesioni e 296 immagini suddivise in categorie. 77 sono lesioni maligne di cui: 78 melanomi, 23 BCC, 7 SCC e 95 sono lesioni benigne di cui: 76 nevi, 3 cheratosi attiniche e 16 appartenenti ad altre categorie. La concordanza dei punteggi DEXI 1.0 e DEXI 2.0 è del 90% e la coerenza delle misurazioni del 95%, considerando tutte le immagini dermoscopiche collezionate. Abbiamo valutato le prestazioni diagnostiche di DEXI per il sottogruppo di casi melanoma e nevi. La sensibilità e la specificità di DEXI 2.0 risultate per la diagnosi di melanoma sono rispettivamente 78,72 e 77,63. I valori di DEXI 1.0 sono 65,96 e 88,16. Abbiamo esaminato le curve caratteristiche (ROC) e in termini di quantità diagnostica il valore di DEXI 1.0 è 0,8298 mentre 0,8505 per DEXI 2.0 sempre per casi di melanoma. Questi risultati preliminari mostrano una buona concordanza e affidabilità dei valori tra le due versioni di AI. Inoltre, l'accuratezza della nuova versione di AI nella diagnosi del melanoma è migliore rispetto alla versione precedente, c'è quindi stato un miglioramento. Il nostro studio sottolinea l'utilità dell'applicazione dell'IA nella pratica clinica e nella prevenzione dei tumori della pelle. Le prospettive future sono quelle di ampliare il set di immagini ed estendere le analisi ad altre regioni in Italia, in modo da poter addestrare ulteriormente DEXI e valutarne le capacità diagnostiche in altre categorie di lesioni.
|
Abstract
Cutaneous diagnosis is often visually based; the quality of the images that are obtained and the information that can be derived from them are critical in this practice. Risk prediction imaging technologies are however changing the landscape of dermatology and appear to have great potential to improve skin cancer screening. Artificial intelligence (AI)-based automated devices can be a valuable support tool for dermatologists. Using deep learning convolutional neural networks (CNNs) for malignancy risk assessment can change classical diagnostic practice.
My thesis work was carried out within Canfield Scientific company, global leader in Medical Dermatology Systems. One of the challenges of the Canfield is to improve computer aided diagnosis based on CNN system called DEXI. DEXI (Dermoscopy Explained Intelligence) 2.0 is the newest Canfield’s AI, through the use of epiluminescence dermatoscopy and deep learning image analysis it produces information about lesion classification and the risk of malignancy. DEXI 2.0 is recently trained with various strategies and differing training options.
The aim of the present study is to investigate the diagnostic performance of DEXI 2.0 version, in skin lesions detection in an italian real-world setting, based on a ground truth of histopathology. The new rules require Canfield to generate clinical data about safety and performance of their devices. Therefor the second purpose of the study is to generate clinical data. In both tasks algorithm was tested on its ability to recognise the eight ISIC (The International Skin Imaging Collaboration) 2019 categories. This work represents a very useful Italian pilot study for subsequent studies.
Dermoscopic images of skin lesions were obtained from Italian clinics trough VIDIX 4.0 and VTRACK 4.0 systems. We have created dataset to relate metadata and images. The images were analysed using the AI system and the data were processed using statistical methods. We included 141 patients (48.9% female e 51.1% men). The dataset includes 172 lesions and 296 images divided into categories. 77 are malignant lesions: 47 melanoma, 23 BCC, 7 SCC and 95 are benignant lesions: 76 nevus, 3 actinic keratosis and 16 other. The concordance between DEXI 1.0 and DEXI 2.0 score is 90% and the consistency of mesurements 95%, considering all dermoscopic images collected. We have evaluated DEXI diagnostic performance for a subgroup of melanoma and nevus cases. DEXI 2.0 sensitivity and specificity for melanoma diagnosis are 78.72 and 77.63 respectively. DEXI 1.0 values are 65.96 and 88.16. We examined the receiver operating characteristic (ROC) curves and in terms of diagnostic quantity DEXI 1.0 value is 0.8298 and 0.8505 for DEXI 2.0 targeting melanoma. These preliminary results show good concordance and values reliability between two AI versions. In addition, the accuracy of the new AI version in melanoma diagnosis is better than previous version, so there has been an improvement.
Our study emphasises the utility of applying AI in clinical practice and prevention to skin cancers. Future prospects are to expand the image set and extend the analysis to other regions in Italy, so that DEXI can be further trained and its diagnostic capabilities in other lesion categories can be evaluated.
|