Riassunto analitico
La Tesi in oggetto inquadra l’implementazione della metodologia di Apprendimento per Rinforzo (una branca dell’Intelligenza Artificiale) ad un caso di studio dell’azienda Engineering Ingegneria Informatica S.p.A.: un sistema di produzione flessibile (FMS). Tramite apprendimento per rinforzo, il problema viene affrontato identificando uno o più agenti in grado di interagire con l’ambiente circostante (il modello della linea di produzione nel suo complesso, in questo caso), di poter osservarne gli stati e poter avere un impatto su questi tramite l’attuazione di azioni. La scelta delle azioni è soggetta alle possibili ricompense (o punizioni) associate al cambiamento di stato che ne consegue. La connessione tra la metodologia adottata ed il problema avviene mediante la Simulazione, garantendo un ambiente di apprendimento privo di rischi, a costi ridotti e altamente abilitante all’interazione agente-sistema. Questo progetto ha quindi lo scopo di avvalorare l’efficacia dell’uso concomitante di approcci di simulazione e di apprendimento per rinforzo per risolvere un caso industriale. Negli ultimi anni, infatti, grazie all’adozione di algoritmi di Deep Learning, basati su reti neurali, per implementare metodologie di apprendimento per rinforzo, è divenuto possibile ottenere risultati interessanti anche in tale ambito. L’adozione dell'apprendimento per rinforzo è resa semplice e maggiormente veloce grazie all’utilizzo, all’interno del progetto, dello strumento denominato Pathmind, avente l’obiettivo di migliorare l’integrazione tra simulazione e apprendimento per rinforzo. Il modello è stato testato sotto una moltitudine di configurazioni, enfatizzando di volta in volta diversi aspetti da ottimizzare (dalla schedulazione dei prodotti alla gestione delle risorse), dimostrando le potenzialità di questo approccio alternativo.
|
Abstract
This thesis focuses on the implementation of the Reinforcement Learning methodology for a case study related to Engineering Ingegneria Informatica S.p.A. company: a flexible manufacturing system (FMS). Through reinforcement learning, the case is addressed by the identification of one or more agents capable of interactions with the environment (the production line model). The agent can observe environmental states and have an impact on them through action implementation. Actions choice is subject to the possible rewards (or punishments) associated with the resulting state changes. The link between the adopted methodology and the addressed problem occurs through Simulation, providing a low-cost and risk-free environment, highly capable of enabling agent-system interaction. This project aims to prove the effectiveness of the concomitant use of simulation and reinforcement learning approaches to solve an industrial case. Indeed, in recent years, thanks to Deep Learning algorithms adoption (based on particular neural networks) to implement reinforcement-learning methodologies, it has become possible to obtain remarkable results for this area. The adoption of reinforcement learning is made simple and faster thanks to the use, within the project, of the tool called Pathmind, with the aim of improving the integration between simulation and reinforcement learning. The model has been tested from a multitude of configurations, emphasizing each time different aspects to try to optimize (from product scheduling to resource management), demonstrating the potential of this alternative approach.
|