Riassunto analitico
Gli algoritmi di clustering costituiscono uno step importante nel processo di data mining: essi permettono di riconoscere pattern all'interno di grandi set di dati, quando non si dispone di alcuna conoscenza a priori se non dei valori osservati. Si tratta di una tecnica statistica multivariata il cui obiettivo consiste nel raggruppare oggetti simili secondo un insieme di variabili misurate, così da identificare tendenze, relazioni e strutture che altrimenti non sarebbero evidenti. Dati i requisiti minimi di conoscenza del dominio, il clustering si adatta bene per applicazioni di segmentazione nella ricerca di pianificazione. In particolare, con riferimento all'attività di tirocinio svolta presso l'azienda Game7Athletics, consideriamo il problema di ottimizzare la pianificazione dell'assortimento di negozi: ad oggi, infatti, il processo di assortimento viene gestito manualmente e dipende fortemente dall'intervento umano. L'azienda, insieme alla società di consulenza Advison, ha dunque deciso di attivarsi per implementare un tool che aumenti il grado di automazione del processo e ottimizzi l'assortimento di prodotti e i volumi di acquisto. La sperimentazione presentata nel corso del lavoro di tesi si inserisce all'interno di questo più ampio progetto, costituendone la prima fase e proponendosi di creare opportuni gruppi di negozi con comportamenti simili sulla base di vendite e capacità. A partire dall'idea iniziale, che presupponeva il solo utilizzo di due variabili, si è pensato di includerne altre due per un totale di quattro, per poi esplorare diverse tecniche di clustering. Infine, si riportano i risultati ottenuti dal punto di vista sia matematico che delle esigenze aziendali, osservando che i due potrebbero non coincidere. Completano il lavoro di tesi alcune tecniche di riduzione di dimensionalità per scopi di visualizzazione grafica.
|