Riassunto analitico
Questa tesi affronta l'argomento dei modelli generativi data-driven per la generazione di dati sintetici, concentrandosi sulla generazione di serie storiche in ambito medico. Oltre a descrivere come funzionano i modelli generativi più noti, affrontiamo il problema della creazione di serie storiche di accelerometri sintetiche a partire da tracce di camminate di pazienti malati di Parkinson. Abbiamo sviluppato un nuovo framework per la generazione di dati in grado di estrarre intervalli di camminata (walking bout) da serie storiche di accelerometri grezze, sfruttare gli intervalli più significativi per la generazione di nuovi bout sintetici e infine inserire questi ultimi nelle serie storiche originali. Per valutare la qualità dei dati generati, il framework viene testato su un dataset reale, messo a disposizione dai nostri collaboratori del "Brain and Movement research group" dell'Università di Newcastle e composto dai dati di 28 pazienti col Parkinson, ognuno monitorato per 7 giorni. Il framework è poi validato tramite metriche diverse, come test statistici sulle caratteristiche della camminata e altri metodi specifici e di solito utilizzati per validare la generazione di dati sintetici. Grazie ai risultati ottenuti, questa tesi fornisce supporto al problema concreto della carenza di dati di accelerometri nel settore medico.
|
Abstract
This dissertation concerns with data-driven generative models for synthetic data generation, with a specific focus on time series generation for healthcare. Along with the description of how the most popular generative algorithms work, we also address the issue of creating synthetic accelerometer time series from walking activity traces of patients affected by Parkinson's disease. To this end we develop a novel framework for synthetic data generation that can extract walking bouts from raw accelerometer data, exploit the most reliable ones to generate new synthetic bouts and inject them back in the original time series. To assess the quality of the generated data, the framework is tested on a real dataset, which is composed of the data of 28 patients with Parkinson's, each one recorded for 7 days, provided to us by our collaborators from the Brain and Movement research group at Newcastle University.. It is then evaluated through application specific metrics, i.e. statistics of the walking features, as well as other validation methods usually adopted to compare data generation solutions. Thanks to the obtained results, this dissertation provides a support to the tangible problem of accelerometer data paucity in healthcare.
|