Riassunto analitico
Negli ultimi anni, l'apprendimento supervisionato di reti neurali convoluzionali (CNN) ha raggiunto risultati notevoli per i task di classificazione delle immagini e, senza dubbio, la disponibilità di dataset etichettati su larga scala ha rappresnetato un'importante risorsa. In tal senso però, la definizione di un'etichetta dipende spesso dal dominio di applicazione e non è sempre possibile associare una label al dato, poichè tale operazione risulta costosa e non scalabile rispetto alla mole di dati a disposzione oggigiorno. Per i motivi appena discussi, è facile avere a che fare con dataset annotati in modo approssimativo, per cui vengono definite delle classi a 'grana grossa', debolmente informative per la risoluzione di un task di classificazione. In questo elaborato, sono presenti degli esperimenti atti alla dimostrazione e all'analisi di come, ricavando in modo self-supervised le label delle classi a 'grana fine', si possa migliorare l'accuracy di una CNN nella classificazione delle classi a grana grossa. I risultati sperimentali, infatti, mostrano che addestrare le CNN con etichette a grana fine migliora sia le capacità di ottimizzazione (in questo caso l'accuracy su set di dati a grana grossa) che di generalizzazione della rete, in quanto il modello è addestrato sulla classificazione di entrambe le tipologie di etichette. Inoltre, le sotto-classi trovate dalla routine di sub-class discovery risultano coerenti con i domini di applicazione dei dataset usati per gli esperimenti, suggerendo di fatto l'aggiunta di un ulteriore livello di dettaglio nell'annotazione delle immagini.
|