Riassunto analitico
La previsione del fabbisogno idrico costituisce un importante informazione per i produttori di acqua potabile, essa permette loro di prendere decisioni operazionali, tattiche e strategiche (Billings & Jones, 2008; Gardiner & Herrington, 1990). Secondo Donkor et al. (2012), sebbene le tecniche di previsione siano conosciute da tempo, la loro applicazione in questo settore presenta diverse criticità. Fra esse: la difficoltà di reperimento dei dati utili e affidabili, il numero elevato di variabili che si ritiene possano influenzare il consumo d’acqua (Billings & Jones, 2008; Gardiner & Herrington, 1990) e i differenti orizzonti di previsione da tenere in considerazione. Per rispondere, in parte, a queste criticità, si è proceduto seguendo le fasi del processo di estrazione di conoscenza dai dati: Cross Industry Standard Process for Data Mining (CRISP-DM, 2000). Il processo è stato applicato al caso di studio riguardante la previsione dei consumi idrici per l’azienda produttrice di acqua potabile nella regione Ile de France. Le previsioni, eseguite su scala giornaliera, coprono tre orizzonti temporali: previsioni per l’indomani, a 15 giorni e a 3 anni. Esse servono all’azienda per pianificare gli interventi di manutenzione della rete idrica. I dati a disposizione sono stati arricchiti con dati disponibili sulle piattaforme open-data, il numero di variabili in ingresso agli algoritmi di previsione è stato ridotto grazie al metodo fattoriale dell’analisi in componenti principali. Per le previsioni di breve termine sono messi a confronto diversi metodi previsionali: metodi delle serie storiche, statistici e di machine learning. Due misure d’errore MAE e RMSE sono utilizzate per confrontare le performance dei modelli. Per le previsioni di lungo termine un metodo misto è proposto, esso combina: (1) serie temporali SARIMA e (2) l’algoritmo di machine learning Random forests. Le elevate precisioni ottenute sono, infine, esposte assieme all’analisi delle variabili più esplicative dei modelli di previsione. Il processo è stato in gran parte automatizzato grazie ad un progetto eseguito in ambiente di sviluppo KNIME/R.
|