Riassunto analitico
I social, che sono ormai diventati parte integrante della nostra quotidianità, e la digitalizzazione dei vari settori economici hanno reso la quantità di materiale prodotto online impossibile da poter essere analizzata dall’essere umano. Per questo motivo negli ultimi anni l’estrazione automatica di eventi da testi ha attirato l’attenzione dei ricercatori rendendo questo task un’opportunità per la creazione di nuovi business. Nonostante sia un campo di ricerca che esiste da più di trent’anni solamente grazie alle recenti scoperte nel campo del natural language process, l’esplosione del deep learning e la presenza di dataset sempre più grandi ha reso l’estrazione di eventi da documenti una realtà tangibile. Le fasi iniziali del mio lavoro si sono focalizzate sullo studio delle diverse metodologie di Event Extraction, in particolare dei modelli per l’estrazione a livello di documento. Dopo la prima fase di studio ho applicato diversi modelli allo stato dell’arte su un dataset in lingua italiana su crimini dell’area modenese trasformando i testi in dati strutturati contenenti il tipo di evento e le 5W associate. Come si vedrà dai risultati ci sono ancora molte sfide aperte e possibilità di crescita per questo campo di ricerca.
|