Riassunto analitico
Il progetto svolto e descritto in questo lavoro di tesi nasce dall'esigenza, di un famoso marchio di alta moda (committente), di ottenere predizioni di tipo propensity (propensione al riacquisto di ciascun cliente) applicando un opportuno modello di machine learning a dati di acquisto in proprio possesso. Il committente aveva già sviluppato precedentemente la fase di data analisys e di scelta dell'algoritmo di machine learning più adatto al proprio contesto, ma gli script SQL, i notebook Python e i modelli ottenuti non erano integrati nei propri sistemi. Lo scopo del progetto, quindi, è stato quello di ingegnerizzare l'intero workflow e di integrarlo con le architetture informatiche del committente, ovvero di realizzare un sistema integrato in grado di raccogliere i dati presenti nel data warehouse del committente, allenare il modello di machine learning e fornire le predizioni richieste in modo automatizzato o su richiesta. La prima fase del progetto ha previsto l'analisi dei requisiti e dei sistemi informatici in cui il progetto avrebbe dovuto integrarsi, i quali hanno determinato le scelte architetturali e tecnologiche del progetto stesso le quali sono ricadute sull'utilizzo della nuova piattaforma di gestione assistita dei processi di machine learning offerta tra i servizi di Google Cloud Platform, Vertex AI. Successivamente è stata necessaria una fase di analisi e di refactoring del codice in possesso del committente (SQL e Python) in modo da ottenere script di data ingestion e data preparation più gestibili e mantenibili e per adattarli ai nuovi requisiti di progetto. In seguito, ci si è occupati della fase di ingegnerizzazione del processo, dividendo il processo in due fasi distinte: training e prediction. Per ognuna delle fasi è stata realizzata una pipeline, (gestite da Vertex) che in maniera schedulata o tramite comando potevano essere eseguite per ottenere rispettivamente un modello aggiornato, ovvero un modello allenato anche sui nuovi dati, e nuove predizioni aggiornate e/o sui nuovi clienti.
|