Riassunto analitico
La ragione che spinge lo studio dell'Intelligienza Artificiale è la possibilità di ottenere un sistema in grado di imparare a svolgere compiti specifici, nella speranza di semplificare la vita delle persone. Negli ultimi anni, innovazioni nel campo del Deep Learning hanno portato ad una crescita pressoché costante delle prestazioni di tali sistemi. Tuttavia, questi richiedono un insieme di dati per l'allenamento che sia indipendentemente e identicamente distribuito. Violare questo principio porterebbe, infatti, a dimenticare la conoscenza passata e sostituirla con quella nuova. Lo scenario chiamato Continual Learning, risalente agli inizi del 1990, ha come obiettivo la comprensione e la risoluzione di tale problema. Le tecniche più promettenti utilizzate prendono in considerazione un insieme di dati completamente annotato. Fornire tale informazione per ogni esempio usato durante l'allenamento è, tuttavia, molto costoso, dato che richiede molte ore di lavoro da parte di operatori umani. In questo lavoro esaminiamo l'interazione tra metodi comuni nell'ambiente semi-supervised e un accumulatore di conoscenza passata, per evitare di dimenticarla.
|
Abstract
The main reason why practitioners study Artificial Intelligence is to obtain a system that learns and performs some specific duties like a human, in an effort to ease the life of many. In the last few years, advances in Deep Learning lead to a steady performance growth. All these systems, however, require a training dataset with examples independently and identically distributed. Indeed, violating this principle would cause a phenomenon called catastrophic forgetting, where a model replaces part of its past knowledge with new one. Continual learning aims to understand and solve this problem, which dates back to the 1990s. The most promising techniques proposed take into consideration a fully supervised scenario, where each train example has an associated label. Providing such ground-truth information, however, has a great cost, since it requires many hours of human labour. In this work we investigate the interaction of common semi-supervised approaches a rehearsal technique, employed to avoid forgetting.
|