Tesi etd-09232024-224629

Tipo di tesi

Tesi di laurea magistrale

Autore

BOSCHI, SIMONE

URN

etd-09232024-224629

Titolo

Metodologia per la generazione e valutazione di un dataset sistetico di notizie criminali

Titolo in inglese

Struttura

Dipartimento di Ingegneria "Enzo Ferrari"

Corso di studi

Ingegneria informatica

Commissione

Nome Commissario	Qualifica
PO LAURA	Primo relatore
BONISOLI GIOVANNI	Correlatore
ROLLO FEDERICA	Correlatore

Parole chiave

Dataset sintetico
Estrazione
Generazione testuale
LLM
Valutazione

Data inizio appello

2024-10-17

Disponibilità

Accesso limitato: si può decidere quali file della tesi rendere accessibili. Disponibilità mixed (scegli questa opzione se vuoi rendere inaccessibili tutti i file della tesi o parte di essi)

Data di rilascio

2064-10-17

Riassunto analitico

L'obiettivo di questa tesi è quello di trovare una metodologia adeguata e il modello migliore per la generazione data-to-text di notizie di furti. Utilizzando diversi Large Language Models (LLMs), quali Mistral, LLAMA2, LLAMA3, LLAMANTINO3 e Zephyr.
Il processo è composto da una prima fase di “estrazione” dei dati da molteplici articoli di giornale, che verranno utilizzati successivamente come input della seconda fase. Questi dati comprendono tutte le informazioni riguardanti le 5W (who, what, when, where, how).
Il secondo step riguarda la “generazione” di una notizia sintetica, quest’ultima deve contenere tutte le informazioni in input ed essere realistica.
Infine, si ha la valutazione della correttezza di queste notizie generate, secondo diverse metriche, che analizzano la lunghezza, il tempo di creazione, similarità con il testo originale.

Abstract

File

Nome file	Dimensione	Tempo di download stimato (Ore:Minuti:Secondi)
Nome file	Dimensione	28.8 Modem	56K Modem	ISDN (64 Kb)	ISDN (128 Kb)	piu' di 128 Kb
Ci sono 1 file riservati su richiesta dell'autore.
Contatta l'autore