Riassunto analitico
Il Deep Reinforcement Learning rappresenta la forma più vicina di apprendimento umano in grado di imparare dalla propria esperienza, esplorando e sfruttando l’ambiente sconosciuto. La sua applicazione nell’ambito della sicurezza informatica è in ampia espansione, capace di risolvere problemi di difesa complessi, dinamici e soprattutto ad alta dimensione. La tesi analizza i modelli promossi in letteratura e si concentra sullo sviluppo di una politica di controllo della supervisione che monitora continuamente le condizioni del sistema ed interviene durante un comportamento anomalo, attraverso funzionalità di active defence e cyber deception. Si conclude con un approfondimento sulle osservazioni riscontrate durante le interazioni con il sistema, delle sue prestazioni e dell’accuratezza nella scelta delle azioni intraprese dall’autonomous decision making system in risposta.
|
Abstract
Deep Reinforcement Learning represents the closest form of human learning able to learn from their own experience, exploring and exploiting the unknown environment. Its application in the field of information security is expanding widely, capable of solving complex, dynamic and above all large-scale defence problems. The thesis analyzes the models promoted in the literature and focuses on the development of a supervision control policy that continuously monitors the system conditions and intervenes during anomalous behaviour, through active defence and cyber deception functions. It ends with an in-depth analysis of the observations found during interactions with the system, its performance and accuracy in the choice of actions taken by the autonomous decision-making system in response.
|