Riassunto analitico
La gestione dei flussi di veicoli utilizzando semafori intelligenti capaci di adattare il proprio comportamento in base alla situazione stradale rilevata è un obiettivo non così facilmente raggiungibile, soprattutto nel caso in cui si considerasse una rete stradale di grandi dimensioni nella quale molteplici semafori cercano di ottimizzare il proprio obiettivo indivuale. Il Multiagent Reinforcement Learning (MARL) è uno degli approcci maggiormente utilizzati in letteratura per quanto riguarda la risoluzione di questo particolare problema. In questo documento si cerca di analizzare diversi scenari, in ognuno dei quali le entità semaforiche coinvolte utilizzano diverse strategie al fine di migliorare le performance ed i tempi di training. Gli esperimenti effettuati interessano diversi aspetti dell’apprendimento, dalla scelta della funzione di reward più performante, all’utilizzo di strategie “curriculum learning” piuttosto che all’introduzione di informazioni globali all’interno dello stato osservabile di ciascun agente.
|