Riassunto analitico
Le reti generative avversarie sono una classe di algoritmi di intelligenza artificiale utilizzati nell'apprendimento automatico non supervisionato in grado di generare immagini che sembrano autentiche. In questa tesi, attraverso l'uso del framework Tensorflow, è stato implementato un particolare modello di GAN chiamato PIX2PIX, che consente di ottenere facciate di edifici partendo da una semplice sezione laterale. L'esportazione online del modello è stata effettuata utilizzando CloudML, quindi sono stati tentati diversi approcci per cercare di migliorare i risultati visivi ottenuti; tra cui CoordConv, il meccanismo di self-attention applicato alle immagini e, in particolare, il modello chiamato DRPAN. Infine, sono state valutate alcune soluzioni per possibili miglioramenti ed estensioni future, in particolare per quanto riguarda la creazione del dataset attraverso lo strumento UnrealCV.
|
Abstract
The generative adversarial networks are a class of artificial intelligence algorithms used in unsupervised machine learning which can generate images that look authentic.
In this thesis, through the use of the Tensorflow framework, a particular model of GAN called PIX2PIX has been implemented, which allows obtaining facades of buildings starting from a simple side section. The online export of the model was carried out using CloudML, so various approaches were tried to try to improve the visual results obtained; including CoordConv, the self-attention mechanism applied to images, and in particular, the model called DRPAN. Finally, some solutions have been evaluated for possible future improvements and extensions, in particular regarding the creation of the dataset through the UnrealCV tool.
|