Riassunto analitico
Con l’aumento della potenza computazionale dei computer sono diventate sempre più accessibili e comuni le tecniche di elaborazione dei dati tramite modelli di deep learning. La grande diffusione dello shopping online ha portato a un sempre maggiore sviluppo di soluzioni volte ad aumentare l'esperienza online degli utenti. Il virtual try-on, ovvero prova virtuale, è una tecnica che mira a trasferire un indumento su una persona di riferimento rendendo l’immagine generata il quanto più possibile realistica. Per raggiungere questo obiettivo nel tempo sono stati valutati differenti approcci, le due macrocategorie sono date dallo sviluppo di architetture in grado di elaborare e generare immagini bidimensionali e architetture basate su dati tridimensionali. Gli approcci basati su modelli 3D hanno costi di installazione hardware elevati e una grande difficoltà nella raccolta di dati annotati, che ne limitano l'implementazione su larga scala. Le tecniche implementate in questo progetto sono state attuate tramite l'elaborazione di dati 2D, pertanto tutti i modelli che sono stati presi in considerazione come competitor sono modelli che utilizzano la stessa tipologia di dati. Molti progetti precedentemente sviluppati si focalizzano solo sulla parte superiore del corpo, introducendo così una notevole limitazione di questa tecnologia nell'uso reale. Il progetto che è stato sviluppato e realizzato durante questa tesi ha utilizzato un set di dati multi-categoria che è tre volte più grande di qualsiasi altro set di dati pubblicamente disponibile. Oltre all'utilizzo di questo set di dati, una grande innovazione introdotta è stata quella di utilizzare il Transformer per l'estrazione delle caratteristiche degli abiti e delle persone, introducendo così una dipendenza a livello globale tra l’input e l’output che ha permesso di raggiungere risultati che hanno superato sia qualitativamente che quantitativamente i modelli già esistenti.
|
Abstract
With the increase in the computational power of computers, data processing techniques using deep learning models have become increasingly accessible and common.
The great diffusion of online shopping has led to an ever-greater development of solutions aimed at increasing users' online experience. Virtual try-on is a technique that aims to transfer a garment to a reference person, making the image generated as realistic as possible. To achieve this goal, different approaches have been evaluated over time, the two macro-categories are given by the development of architectures capable of processing and generating two-dimensional images and architectures based on three-dimensional data. Approaches based on 3D models have high hardware installation costs and a great difficulty in collecting annotated data, which limits their large-scale implementation. The techniques implemented in this project have been implemented through the processing of 2D data, therefore all the models that have been considered as competitors are models that use the same type of data.
Many previously developed designs focus only on the upper body, thus introducing a noticeable limitation of this technology in real use. The project that was developed and implemented during this thesis used a multi-category dataset that is three times larger than any other publicly available dataset. In addition to the use of this dataset, a great innovation introduced was to use the Transformer for the extraction of the features of clothes and people, thus introducing a dependency on a global level between the input and the output that has allowed us to achieve results that have both qualitatively and quantitatively exceeded the existing models.
|