Riassunto analitico
La tesi analizza, con approccio data-driven, i determinanti della domanda di prodotti agroalimentari italiani nel mercato brasiliano, attraverso un percorso metodologico articolato in otto domande di ricerca. Ogni fase amplia progressivamente la pipeline predittiva, integrando variabili strutturali (indicatori macroeconomici), percettive (sentiment mediatico), comportamentali (interesse rilevato su Google Trends) e sistemiche (catastrofi naturali e tecnologiche, instabilità politica, prezzi delle commodities). I modelli impiegati – tra cui regressione lineare, Random Forest, XGBoost, Prophet e SARIMAX – sono stati addestrati su un dataset mensile riferito al periodo 2014–2022 e validati temporalmente sul biennio 2023–2024, dopo un tuning iperparametrico. In tutte le fasi è stata applicata una selezione delle variabili predittive più rilevanti, basata sulla feature importance del modello Random Forest, con l’obiettivo di ridurre il rumore informativo e rafforzare la robustezza delle previsioni. Le analisi evidenziano che l’integrazione sinergica di segnali eterogenei, opportunamente selezionati, migliora l’accuratezza predittiva e consente di esplorare la sensibilità del sistema export rispetto a variazioni esogene. Il lavoro si conclude con la simulazione di scenari alternativi, che mettono in luce l’importanza di modelli flessibili e interpretabili per comprendere le dinamiche della domanda estera in un contesto globalizzato e interconnesso.
|
Abstract
This thesis adopts a data-driven approach to investigate the determinants of demand for Italian agri-food products in the Brazilian market, following a methodological framework articulated into eight research questions. Each phase progressively expands the predictive pipeline by integrating structural variables (macroeconomic indicators), perceptual variables (media sentiment), behavioral signals (Google Trends), and systemic factors (natural and technological disasters, political instability, commodity prices). The models employed – including linear regression, Random Forest, XGBoost, Prophet, and SARIMAX – were trained on monthly data from 2014 to 2022 and temporally validated on the 2023–2024 period, following hyperparameter tuning. In every phase, the most informative predictors were selected using Random Forest feature importance, with the aim of reducing noise and enhancing model robustness. The analysis shows that the synergistic integration of heterogeneous signals, when properly filtered, improves forecasting accuracy and allows for an exploration of the export system’s sensitivity to exogenous shocks. The study concludes with the simulation of alternative scenarios, highlighting the value of flexible and interpretable models for understanding foreign demand dynamics within a globalized and interconnected context.
|