Riassunto analitico
Lo scopo della tesi è quello di studiare l’efficacia e la duttilità delle tecniche di deep reinforcement learning applicandole a varie tipologie di problemi di difficoltà crescente. Per comprendere meglio il funzionamento di queste tecniche, si illustrano dapprima i principali i concetti su cui si basano tutte le soluzioni proposte, ovvero MDP (Markov Decision Process) e neural networks. Si passa quindi a descrivere più nel dettaglio le tecniche di reinforcement learning (apprendimento per rinforzo) e deep learning (apprendimento profondo) e come queste possano tra loro combinarsi per la risoluzione di problemi complessi. Si conclude riportando, per ciascuno dei problemi proposti, una descrizione dettagliata di tutte le soluzioni sperimentate e dei risultati ottenuti opportunamente commentati.
|