Riassunto analitico
Con la presente tesi di laurea magistrale si intende descrivere la realizzazione di un sistema di visione artificiale appositamente progettato per l'identificazione di brand in immagini scattate in contesti sportivi. Sviluppato in collaborazione con l'impresa F.T.P. S.r.l., il progetto è stato concepito per rispondere alle specifiche richieste di un'azienda partner coinvolta. Al centro della ricerca si intende descrivere l'elaborazione di una pipeline di modelli di deep learning, progettata per il riconoscimento degli atleti e degli indumenti sportivi, nonché per l'assegnazione dei brand corrispondenti. Viene inoltre citata l'adozione di tecnologie OCR per il rilevamento dei numeri di pettorina, arricchendo i risultati con informazioni supplementari, quali età e genere degli atleti, fornendo analisi statistiche approfondite per il partner commerciale. Il design del sistema è stato sperimentato in condizioni reali, affrontando le sfide tipiche della visione artificiale. L'analisi comparativa tra le Siamese Neural Networks per le operazioni di identificazione e l'applicazione del transductive fine-tuning su classificatori di immagini intende evidenziare la potenziale utilità di entrambi gli approcci nel supportare il few-shot learning. Quest'ultimo emerge come una metodologia promettente per la classificazione dei brand in scenari dinamici che si estendono oltre il contesto sportivo per abbracciare anche le esigenze del mercato.
|
Abstract
The purpose of this master's thesis is to describe the realization of a computer vision system specifically designed for brand identification in images taken in sports environments. Developed in collaboration with the company F.T.P. S.r.l., the project was designed to meet the specific requirements of an involved partner company.
The focus of the research is intended to describe the development of a pipeline of deep learning models designed for the recognition of athletes and sportswear, as well as the assignment of corresponding brands. The adoption of OCR technologies for bib number detection is also mentioned, enriching the results with additional information, such as athletes' age and gender, providing in-depth statistical analysis for the business partner.
The system design was tested under real-world conditions, addressing typical computer vision challenges.
The comparative analysis between Siamese Neural Networks for identification operations and the application of transductive fine-tuning on image classifiers aims to highlight the potential utility of both approaches in supporting few-shot learning. The latter emerges as a promising methodology for brand classification in dynamic scenarios that extend beyond the sports context to embrace market needs as well.
|