Riassunto analitico
L'intelligenza artificiale oggi è già una disciplina concreta adottata in innumerevoli settori, con risultati eccellenti. Con l'aumentare di difficoltà del compito da svolgere, la sua efficcia cala significativamente. Attraverso le reti neurali si possono garantire ottimi risultati a patto che ci siano abbastanza dati per l'apprendimento. In casi reali spesso non abbiamo una grande quantità di dati annotati riguardanti un compito specifico. Esistono studi di ricerca che provano a superare questo limite in diversi modi, introducendo a volte nuove sotto categorie di algoritmi in letteratura. Lo scopo di questo lavoro è di fornire un algoritmo che può essere allenato con dati non specifici, senza il bisogno di essere annotati da esseri umani, e capace poi di adattarsi a nuovi diversi compiti con solo pochi dati etichettati, in uno scenario continuo dove input successivi possono appartenere a compiti distinti. Vengono combinate assieme più tecniche appartenenti a diversi ambiti dell'intelligenza artificiale: clustering e apprendimento non supervisionato, utile a gestire i dati non annotati; meta-learning, che riguarda metodi per "imparare ad imparare", migliorandone la velocità di adattamento; continual learning, lo studio riguardante l'apprendere in maniera prolungata nel tempo.
|
Abstract
Nowadays, machine learning is already a concrete business adopted in countless fields, with excellent results. However, while tasks grow in difficulty, performances of artificial intelligence can significantly drop. Deep learning, using deep neural networks, can guarantee optimal results if fed with enough training data. In real cases, we do not often have a great amount of labelled data regarding a specific task. Research studies try to overcome this problem in different ways, also introducing completely new sub-fields within machine learning literature. In this work, we aim to provide an algorithm that can be trained with general data, also not labelled, and then capable to adapt to new different tasks with only a few labelled examples, in a continual scenario where subsequent inputs can belong to different tasks. We combined multiple techniques from different artificial intelligence topics: clustering and unsupervised learning, to handle not labelled data; meta-learning, which is referred to as "learning to learn", to improve fast adaption; continual learning, covering algorithms that can continuously learn in time.
|