Riassunto analitico
L'obiettivo di questa tesi è quello di trovare una metodologia adeguata e il modello migliore per la generazione data-to-text di notizie di furti. Utilizzando diversi Large Language Models (LLMs), quali Mistral, LLAMA2, LLAMA3, LLAMANTINO3 e Zephyr. Il processo è composto da una prima fase di “estrazione” dei dati da molteplici articoli di giornale, che verranno utilizzati successivamente come input della seconda fase. Questi dati comprendono tutte le informazioni riguardanti le 5W (who, what, when, where, how). Il secondo step riguarda la “generazione” di una notizia sintetica, quest’ultima deve contenere tutte le informazioni in input ed essere realistica. Infine, si ha la valutazione della correttezza di queste notizie generate, secondo diverse metriche, che analizzano la lunghezza, il tempo di creazione, similarità con il testo originale.
|