Riassunto analitico
Con Anomaly Detection si intende il processo con cui si vogliono ricercare i difetti in un oggetto attraverso l'analisi di immagini. I recenti diffusion model hanno dimostrato un'estrema efficienza in questo campo, con risultati superiori alle reti generative adversarial (GANs). L'idea è quella di utilizzare un diffusion model per generare immagini corrette, che evidenzino i difetti quando vengono messe a confronto con l'originale. Il problema principale è l'eterogeneità delle anomalie, che può riguardare differenze nella texture, nella forma o nei dettagli. In questo lavoro introduciamo un metodo che esplora diverse strategie per risolvere il problema, nello specifico utilizziamo un diffusion model che iterativamente cerca di ricostruire un input corrotto da un disturbo a scacchiera. L'intento è di utilizzare alcune parti visibili dell'immagine e ricostruire le mancanti, interpretate come difetti. In questo modo, puntiamo ad individuare gli errori nella forma o nella texture di un oggetto che esce da un processo produttivo, iniziando da una vista parziale e non da un disturbo completo. I risultati ottenuti dal dataset di MVTec dimostrano un'efficace riconoscimento dei difetti con diversi tipi di architettura.
|
Abstract
Anomaly Detection is a challenging industrial task that aims at recognizing defects in objects through image analysis. Recent diffusion models have demonstrated extreme efficiency in the field of image generation, with results overcoming Generative Adversarial Networks (GANs). Ideally, diffusion models are able to generate corrected images that highlight defects when compared with the original ones.
The main issue in this setting is the heterogeneity of the anomalies, which can concern differences in textures, shapes or details.
In this work, we introduce a method that investigates different strategies to address this problem, specifically utilizing a diffusion model that iteratively attempts to reconstruct an input image disrupted by Chessboard Noise. The intent is to use some visible parts of the input image and reconstruct the missing ones, interpreted as defects. This way, we aim at detecting errors in the shape or texture of a produced object, starting from a partial view and not from complete random noise. The results on the MVTec Dataset show an efficient recognition of the defects with different types of architecture.
|