Riassunto analitico
L'anatomia patologica (AP) è un'importante unità ospedaliera che fornisce informazioni estremamente preziose utilizzate nella prevenzione, cura e follow-up dei tumori. Tuttavia, a differenza della radiologia e di altre discipline, l'implementazione di metodi computazionali in AP, la cosiddetta Digital Pathology (DP), è ancora agli albori nonostante i promettenti risultati mostrati in termini di miglioramento dell'efficienza e dell'accuratezza dei patologi nell'effettuare una diagnosi.
Poiché in letteratura sono riportati esempi che mostrano l’effetto dannoso degli artefatti presenti nelle immagini analizzate sulle prestazioni diagnostiche sia dei patologi che degli algoritmi di DP, dotare i laboratori di AP di un sistema di quality assurance in grado di rilevare e limitare questi effetti deve diventare una priorità: solo in questo modo il processo di generazione e scansione di Glass Slide Images (GSI) per ottenere Whole Slide Images (WSI) può essere controllato in modo da rilevare e minimizzare possibili presenze di artefatti e fornire un'immagine di alta qualità da analizzare; inoltre, un sistema in grado di identificare WSI di bassa qualità che possono portare a un disaccordo tra osservatori può essere uno strumento prezioso per avvisare i patologi della possibile necessità di una rilettura delle WSI, onde evitare diagnosi errate.
L’idea alla base di questo progetto di tesi, svolto presso l’Unità di Fisica Medica sita presso l’Arcispedale Santa Maria Nuova – Reggio Emilia, è stata quindi quella di iniziare a gettare le basi per l’implementazione del suddetto sistema di quality assurance per le immagini WSI in grado di supportare l’intero processo di generazione, scansione e diagnosi di vetrini di anatomia patologica.
L'obbiettivo principale è stato quello di generare un sistema capace di identificare WSI di bassa qualità in tempo reale e prevedere se e quali WSI possano portare a (i) un disaccordo fra patologi nella diagnosi sull'HER2 (Human Epidermal Growth Factor Receptor 2 - un recettore trasmembrana overespresso nei tessuti cancerosi della mammella) e (ii) a una diagnosi errata degli algoritmi dovuti ad artefatti e ad altre caratteristiche più nascoste legate all'immagine. Ciò è necessario poiché una diagnosi accurata di HER2 è fondamentale nella valutazione della gravità del tumore e determina a quale trattamento clinico il paziente debba essere destinato: HER2 è quindi il target nella diagnosi del tumore alla mammella per consentire la formulazione di una terapia personalizzata.
Per questo motivo HistoQC, uno strumento open source non marcato CE, è stato utilizzato per valutare la qualità di un campione di WSI presenti negli archivi del laboratorio di anatomia patologica attraverso un'analisi delle immagini stesse in termini di varie caratteristiche che vanno dalla presenza e quantità di area coperta dagli artefatti, all'intensità di colorazione e alla luminosità e al contrasto dell'immagine.
Sono stati quindi implementati due algoritmi di Machine Learning (ML), Logistic Regression e XGBoost, per valutare l'esistenza di una correlazione tra la qualità dell'immagine (rappresentata dalle features relative all'immagine estratte da HistoQC) e il disaccordo sulla diagnosi HER2 tra osservatori (valutato sulla diagnosi effettuata da due patologi sul campione di WSI selezionato).
Nell'ultima parte di questo progetto di tesi sono state valutate le prestazioni diagnostiche dell'algoritmo di analisi di membrana Aperio ImageScope (non ancora validato clinicamente) rispetto a quelle dei patologi, per vedere se fosse in grado di ridurre la variabilità interosservatore e di assistere i patologi in fase diagnostica fornendo risultati concordanti con la diagnosi finale.
|
Abstract
Anatomical pathology (AP) is an important hospital unit that provides highly precious information employed in cancer prevention, care and follow-up. However, unlike in radiology and other disciplines, the implementation of computational methods in AP, the so called Digital pathology (DP), is still in its infancy despite the promising results shown in terms of improving the pathologists' efficiency and accuracy in performing a diagnosis.
Since in literature examples are reported showing the detrimental effect of image artifacts on both the pathologists and the DP algorithms diagnosis performances, to equip the AP laboratories with a quality assurance system able to detect and limit these effects must become a priority. Only in this way the glass slide images (GSI) generation and scanning processes to give whole-slide images (WSI) can be controlled, so that (i) possible artifact occurrences can be detected and minimized and (ii) a high quality level digital image to be analyzed can be provided. Moreover, a system able to identify low-quality WSI that can lead to interobserver disagreement can be a valuable tool in alerting pathologists to the possible need for a re-reading of the WSI to avoid misdiagnosis.
The basic idea of this thesis project, carried out at the Medical Physics and Anatomical Pathology Units located in the Arcispedale Santa Maria Nuova - Reggio Emilia, was then to start laying the foundations for the implementation of the aforementioned quality assurance system for WSI images capable of supporting the whole process of generating, scanning and diagnosing anatomical pathology slides.
The main aim was to generate a system able to identify low-quality WSI in real-time and to predict whether and which WSI might lead to (i) inter-pathologist disagreement in the Human Epidermal growth factor Receptor 2 (HER2 - a transmembrane receptor hyper-expressed in breast cancer tissues) diagnosis and (ii) to algorithms HER2 misdiagnosis, due to artifacts and to other image-related hidden features. This is needed since an accurate HER2 diagnosis is crucial in the assessment of a tumor severity and determines which clinical treatment the patient should be destined for: HER2 is so target for breast cancer diagnosis allowing perzonalized therapies.
For this reason HistoQC, an open source non-CE marked tool, has been used to assess the quality of a set of WSI present in the AP laboratory archives via a punctual analysis of the images themselves in terms of many characteristics ranging from the presence and the amount of area covered by the artifacts, to the staining intensity and to the image brightness and contrast.
Two machine learning (ML) - based algorithms, Logistic Regression and XGBoost, have then been implemented to assess whether a correlation existed between image quality (represented by the image-related features extracted by HistoQC) and inter-observer HER2 diagnosis disagreement (evaluated on the diagnosis performed by two pathologists on the selected WSI).
In the last part of this thesis project the diagnostic performances of the not yet clinically validated Aperio ImageScope membrane analysis algorithm with respect to the pathologists' ones, in order to see if it was able to reduce the interobserver variability and to assist pathologists during at the diagnostic stage by giving concordant results with the final diagnosis.
|