Riassunto analitico
I recenti progressi ottenuti in termini di potenza computazionale e la crescente disponibilità di grandi quantità di dati, hanno contribuito in modo significativo alla popolarità del deep learning, che ha suscitato un notevole interesse da parte delle comunità industriale e di ricerca per le sue eccezionali prestazioni nella risoluzione di problemi complessi in un'ampio dominio di settori. Tuttavia, questi modelli di deep learning sono inclini all'overfitting e un metodo comunemente usato per risolvere questo problema è la data augmentation, una tecnica che prevede la generazione di dati di addestramento aggiuntivi applicando varie trasformazioni al dataset originale. Questo lavoro di tesi mira a risolvere il problema riscontrato da Bioretics srl durante l'addestramento di una rete neurale convoluzionale, in cui la GPU era sottoutilizzata principalmente a causa delle operazioni di data augmentation. È stato analizzato l'impatto della data augmentation in termini di perfomance predittive e di efficienza computazionale, con l'obiettivo di costruire una soluzione in grado di risolvere il problema dell'azienda.
|
Abstract
Recent advancements in computing technology and the growing availability of large amounts of data have enabled the development of deep learning techniques, which have raised significant interest from both industry and research communities for their exceptional performance in solving complex problems across a wide range of domains.
However, these deep learning models are prone to overfitting, and a commonly used method that help mitigate this problem is data augmentation, a technique that involves generating additional training data by applying various transformations to the original dataset.
This thesis work aims to address the issue encountered by Bioretics srl during the training of a convolutional neural network, where the GPU was underutilized mainly due to the data augmentation operations. It has been analyzed the impact of data augmentation in terms of both predictive performance and computational efficiency with the goal of building a solution that could solve the company's problem.
|