Riassunto analitico
In questo lavoro si propone un algoritmo genetico chiamato GADPRS (Genetic Algorithm with Dynamic Penalty for Regressors’ Selection) per la selezione delle variabili esplicative da inserire in un modello di regressione logistica per la stima della probabilità di default ad un anno delle aziende industriali italiane. Lo spazio di ricerca esplorato dall’algoritmo proposto è composto da tutti i possibili sottoinsiemi di variabili che si possono formare combinando diciotto indici di bilancio, ossia le variabili esplicative a disposizione. Tali quozienti sono rappresentativi di cinque aree tipiche della gestione economica e finanziaria aziendale: copertura degli oneri finanziari, solidità patrimoniale e finanziaria, liquidità, gestione del capitale investito ed, infine, redditività. Al classico problema della selezione dei regressori sono stati aggiunti nove vincoli sulle variabili esplicative selezionabili al fine di eliminare la ridondanza informativa di alcuni indici a disposizione che, altrimenti, avrebbero potuto essere scelti nel modello finale, aumentandone la complessità e pregiudicandone la significatività economico-finanziaria. Quello da risolvere è quindi un problema di ottimizzazione vincolata, in cui la funzione obiettivo da ottimizzare è una misura di performance previsionale del modello econometrico specificato dalle variabili esplicative in ingresso. L’utilizzo di algoritmi genetici per risolvere problemi di ottimizzazione vincolata risulta problematico in quanto i tradizionali operatori genetici possono produrre soluzioni non ammissibili anche se applicati a soluzioni candidate appartenenti alla regione ammissibile. In questo lavoro si è deciso di affrontare tale inconveniente trasformando il problema vincolato iniziale in uno di ottimizzazione non vincolata associando alla funzione obiettivo originale una funzione di penalità che penalizza le soluzioni inammissibili, ossia quelle che violano uno o più vincoli. In particolare, si è deciso di utilizzare la funzione di penalità dinamica proposta da Houck e Joines (1994). Inoltre, poiché nella letteratura di riferimento non vi è uno schema teorico condiviso per l’impostazione dei parametri che caratterizzano gli algoritmi genetici, si è deciso di scegliere alcuni di essi empiricamente. In particolare, si sono testati sui dati tutti i trentasei algoritmi genetici GADPRS ottenibili combinando alcuni parametri “fissi” con altri scelti empiricamente. Questi ultimi sono l’operatore di selezione, l’operatore genetico di crossover, la probabilità di crossover e quella di mutazione. Un altro elemento di originalità di questo lavoro consiste nel rendere disponibile nel software R un algoritmo genetico che permetta di risolvere problemi di ottimizzazione vincolata tramite una funzione di penalità dinamica. Per fare ciò è stato necessario apportare vari accorgimenti ad alcune funzioni del pacchetto GA proposto da Scrucca (2013). E’ stata inoltre resa disponibile la funzione two points crossover, non presente in tale pacchetto. I codici impiegati nell’analisi sono riportati in appendice, in modo da rendere replicabile ogni risultato ottenuto.
|