Riassunto analitico
Il tema della sicurezza è di centrale importanza in un mondo dove le azioni terroristiche sono sempre più comuni. Governi e agenzie affrontano queste realtà ogni giorno ma non sempre i mezzi a loro disposizione sono sufficienti a prevenire gli attentati in maniera efficace. L’ambito della sicurezza sfrutta numerose aree della scienza e dell’ingegneria e molteplici sono gli ambiti di studio che è possibile intraprendere. Tra le numerose possibilità di ricerca in questo campo questo lavoro focalizza l’attenzione sul problema della classificazione degli attributi (come età, sesso, ecc.) e di eventuali oggetti (zaini, borse, ecc.) di persone attraverso videocamere di sorveglianza. Tramite l’utilizzo di tecniche di Deep Learning basate sulla Visione Artificiale e attraverso l’impiego di modelli generativi è stato possibile affrontare questo problema in maniera automatica. L’obiettivo di questo lavoro è quello di esplorare le capacità generative delle Generative Adversarial Networks per aumentare la risoluzione delle immagini di persone che tipicamente sono di bassa qualità quando acquisite da videocamere di sorveglianza. La rete è successivamente impiegata per la classificazione degli attributi di persone sfruttando le capacità dei modelli convolutivi. Infine, gli esperimenti dimostrano che tale approccio migliora i risultati dello stato dell’arte in situazioni in cui le immagini sono occluse o di bassa qualità.
|
Abstract
Security is of fundamental importance in a world where terrorist attacks are steadily increasing. Governments and agencies face these realities every day, but not always the means at their disposal are sufficient to effectively prevent those attacks. The security area uses many science and engineering fields, and many are the areas of study available. Among the many research opportunities this work addresses the problem of the classification of attributes (such as age, sex, etc.) and items (backpacks, bags, etc.) of people through security cameras.
Computer Vision based Deep Learning techniques and generative models are exploited to address this problem in an automatic fashion. The objective of the work is to explore the generalization capability of adversarial networks to enhance people image resolution, typically too low when acquired by surveillance cameras. The network is subsequently exploited to detect and classify people attributes by exploiting the power of convolutional models. Eventually, experiments demonstrate that such an approach can improve state of the art results both when the target resolution is poor and the target image is corrupted or occluded.
|