Riassunto analitico
L’ottimizzazione delle risorse nei sistemi di High-Performance Computing (HPC) è fondamentale per migliorare l’efficienza operativa e ridurre i consumi energetici.
Questa tesi, basata sul progetto realizzato durante il tirocinio presso l’azienda Leonardo S.p.A., si concentra sull’analisi dei dati di consumo del cluster HPC davinci-1, con l’obiettivo di estrarre informazioni significative e approfondire la comprensione del comportamento del sistema. I dati, estratti mediante il framework Examon, sono stati sottoposti ad una fase di pre-processing per strutturarli in modo coerente ed efficiente per le analisi. Data l’elevata quantità di informazione da elaborare, è stata utilizzata la libreria Polars per garantire un’elaborazione efficiente e il formato Parquet per ottimizzare l’archiviazione e l’accesso ai dati.
L’assenza di metadati ufficiali ha reso necessaria una ricostruzione delle informazioni disponibili. Per rispondere a questa esigenza, è stato necessario consultare manuali tecnici, repository e documentazioni ufficiali, un lavoro che ha portato alla creazione di una documentazione centralizzata non ufficiale, utile per la consultazione e per una corretta interpretazione dei dati.
Le analisi condotte hanno permesso di individuare pattern di consumo, tendenze nell’utilizzo delle risorse e anomalie nel comportamento del cluster. I risultati ottenuti offrono una visione dettagliata dell’efficienza operativa del cluster HPC davinci-1, contribuendo all’ottimizzazione delle prestazioni complessive e alla gestione consapevole delle risorse computazionali.
|