Riassunto analitico
L'obiettivo di questa tesi è costruire una metodologia per l'utilizzo di modelli di Machine Learning per applicazioni di analisi della concorrenza e individuare modelli utili di distribuzione delle prestazioni per guidare lo sviluppo della vettura. Il caso d'uso trattato sarà l'analisi delle prestazioni delle auto in diverse regioni del circuito in relazione alle caratteristiche fisiche della regione considerata e ad alcuni fattori dinamici legati all'auto stessa. Lo studio copre un ampio spettro di algoritmi (PCA, Clustering, Feed Forward Neural Networks, Random Forest, XGBoost) e tecniche più semplici e classiche come uno studio di correlazione. Gli algoritmi sono spiegati da un punto di vista elementare, per comprenderne il funzionamento di base, le possibili applicazioni e i limiti. L'output ottenuto da questa ricerca ha mostrato un basso livello di correlazione tra performance e parametri descrittivi e una quantità non sufficiente di dati nel dataframe analizzato, di conseguenza le previsioni, anche se decentemente accurate, non sono soddisfacenti. Il caso d'uso è stato molto utile poiché, a causa delle difficoltà incontrate, ha obbligato a testare diverse tecniche. Tuttavia, la metodologia proposta è robusta e flessibile e si è rivelata efficace anche in altre applicazioni.
|
Abstract
The objective of this thesis is to build a methodology for the usage of Machine Learning models for Competitor Analysis applications and detect useful patterns of performance distribution to guide car's development. The use-case treated will be the analysis of the performances of cars in different regions of the circuit in relation to the physical characteristics of the considered region and some dynamical factors related to the car itself. The study covers a wide spectrum of algorithms (PCA, Clustering, Feed Forward Neural Networks, Random Forest, XGBoost) and simpler, more classical techniques such as a correlation study. The Algorithms are explained from an elementary point of view, to understand their basic functioning, possible applications and limitations. The output obtained from this research showed low level of correlation between performances and descriptive parameters and not sufficient amount of data in the analyzed dataframe, consequently the predictions, even though decently accurate, are not satisfying. The use-case was very helpful since, due to the difficulties encountered, it obliged to test several techniques. Neverthless the methodology proposed is robust and flexible, and revealed itself to be effective in other applications.
|