Riassunto analitico
L'utilizzo di modelli di intelligenza artificiale ha ormai assunto un ruolo centrale nella risoluzione di numerose classi di problemi. Le tecniche dedicate alla loro realizzazione sono in continua evoluzione da decenni, ma solamente negli ultimi anni, grazie alla mole sempre crescente dei dati a disposizione delle aziende e ai progressi dei sistemi informativi, esse sono entrate a far parte del core business di numerose organizzazioni. Questo passaggio da progetti di data science che operano in ambienti controllati a veri e propri prodotti software ha portato con sé nuove sfide, principalmente legate alla necessità di mantenere alta l'affidabilità dei modelli durante tutto il periodo della loro messa in produzione e di agevolarne la gestione nel corso del tempo.
Il termine MLOps (da Machine Learning Operations) sta continuando a suscitare un crescente interesse sia a livello di letteratura scientifica che da parte delle organizzazioni che si occupano di data science. Con questo termine ci si riferisce ad un insieme di best practices di ambito multidisciplinare (sviluppo software, operations e data science) che uniscono concetti provenienti dalle metodologie DevOps (es. continuous integration/continuous deployment, versioning, monitoring) a quelli propri del machine learning, con lo scopo di definire un processo di sviluppo delle soluzioni di intelligenza artificiale che sia in grado di garantire scalabilità, efficienza ed affidabilità.
All'interno di questa tesi viene presentato il lavoro di introduzione di pratiche MLOps nel contesto aziendale di Ammagamma, società di data science con sede a Modena. Tale lavoro, svoltosi nel corso di un'attività di tirocinio curricolare presso l'azienda, nasce dalla necessità da parte di quest'ultima di irrobustire i processi operativi legati alla creazione delle proprie soluzioni di intelligenza artificiale. A partire da un'analisi esplorativa del paradigma MLOps e dei relativi strumenti presenti sul mercato e, congiuntamente, da uno studio dei processi aziendali che mirasse ad individuarne le principali criticità, sono stati progettati ed implementati una serie di interventi volti ad introdurre funzionalità di versioning, serving e monitoring dei modelli gestiti dall'azienda.
La presente tesi vuole essere una sintesi di queste attività, con lo scopo di fornire una panoramica di MLOps ed un possibile approccio pratico all'integrazione di tecniche legate a questo recente paradigma all'interno di un contesto aziendale.
|