Riassunto analitico
Negli sport di squadra, la capacità di analizzare dati sta diventando un elemento sempre più determinante per le strategie di gioco e la gestione delle partite. In particolare, nella pallavolo, il fondamentale d’attacco è una delle componenti più decisive, poichè spesso determina l’assegnazione dei punti. L’abilità di prevedere con precisione l’esito di un attacco non solo può permettere all’allenatore di adottare tattiche difensive più efficaci, ma potrebbe anche influenzare in maniera significativa l’andamento di un’intera partita.
Questo lavoro di ricerca si concentra sull’applicazione delle tecniche di Machine Learning per prevedere l’esito degli attacchi dei giocatori del Modena Volley nella fase di cambio palla. Attraverso l’uso di dati raccolti durante il campionato di Superlega della stagione 2023/2024, l’obiettivo è sviluppare dei modelli di classificazione in grado di fornire previsioni accurate che possano essere utilizzate dagli allenatori per prendere decisioni strategiche durante le partite.
Il progetto si articola in diverse fasi, che verranno discusse in dettaglio nei vari capitoli della tesi.
Nel Capitolo 1 verrà trattata la fase di raccolta e preprocessamento dei dati, fondamentale per garantire che le informazioni siano adeguate e pronte per l’analisi predittiva. Questa sezione inizierà con una descrizione del processo di scouting, spiegando come vengono raccolti i dati dalle partite di pallavolo tramite strumenti specializzati. Verranno discussi i parametri principali rilevati durante il gioco, come l’azione di attacco, la zona del campo, il tipo di palla e l’esito dell’azione. Successivamente, sar`a descritta la struttura del dataset iniziale, e verranno illustrate le operazioni di data cleaning e feature engineering necessarie per trasformare i dati grezzi in un formato adatto per l’analisi.
Il Capitolo 2 si concentrerà sulla descrizione dei modelli di classificazione binaria utilizzati per la predizione degli attacchi. Tra gli algoritmi analizzati troveremo: Random Forest, AdaBoost, Support Vector Machines, K-Nearest Neighbors, Extra Trees Classifier e Voting Classifier. Ciascuno di essi verrà descritto nel dettaglio, illustrandone il funzionamento. Inoltre, sarà mostrata la confusion matrix e le metriche di precision, accuracy e recall, utilizzate per valutare le prestazioni dei modelli.
Nel Capitolo 3 verranno riportati i risultati ottenuti con i diversi modelli. In particolare, verranno analizzati gli iperparametri ottimizzati e le prestazioni di ciascun modello.
Il Capitolo 4 sarà dedicato alle conclusioni. Verrà selezionato il modello più performante, analizzando e confrontando non solo le metriche di precision e recall, ma anche la complessità computazionale relativa a ciascun algoritmo. Infine, verranno discusse le problematiche riscontrate, come l’analisi di specifici casi in cui le predizioni del modello risultano errate.
|