Riassunto analitico
La capacità di comporre semplici logiche in ragionamenti complessi gioca un ruolo fondamentale nel processo cognitivo umano. Al contrario, nelle moderne applicazioni di reti neurali, il processo di allenamento mira a massimizzare le performance della rete in un singolo compito. Nell’ambito di questa tesi viene proposto un modello, differenziabile end-to-end, capace di apprendere e memorizzare un set di funzioni primitive utile alla composizione del ragionamento. Il modello presentato viene valutato sul dataset CLEVR, in cui la capacità di comprendere a fondo il contenuto delle immagini è indispensabile al fine di rispondere correttamente alle relative domande. Il lavoro preliminare include l’analisi di modelli ispirati alla neural Turing machine, su un dataset sintetico, creato appositamente per esplorare il problema in oggetto della ricerca. Successivamente, viene accuratamente indagata la possibilità di allenare la rete utilizzando una supervisione debole, confrontando diverse strategie di allenamento delle reti neurali, tra cui varie tecniche di reinforcement learning.
|
Abstract
The ability to compose simple logics in complex reasoning plays a fundamental role in the human cognitive process. On the contrary, in modern deep neural network applications, the training process aims at maximizing the network performance in a single task.
This work proposed a model, end-to-end differentiable, capable of learning and storing in memory a set of primitive functions, useful for the composition of reasoning. The presented model is evaluated on the CLEVR dataset, in which the ability of deeply understanding images content is necessary to correctly answer the related questions.
The preliminary work includes the analysis of models inspired by the neural Turing machine on a synthetic dataset, created specifically to explore the problem in question. Furthermore, the possibility of using weak supervision is carefully investigated, comparing different training strategies of neural networks, including various techniques of reinforcement learning.
|