Tesi etd-11112023-114330

Tipo di tesi

Tesi di laurea magistrale

Autore

BENEDETTI, ELISABETTA

URN

etd-11112023-114330

Titolo

Evoluzione delle Reti Neurali: dal passato al futuro - Un'analisi comparativa di Transformer e DCT-Former nell'Elaborazione del Linguaggio Naturale

Titolo in inglese

Struttura

Dipartimento di Scienze Fisiche, Informatiche e Matematiche

Corso di studi

Matematica (D.M. 270/04)

Commissione

Nome Commissario	Qualifica
ZANNI LUCA	Primo relatore
FRANCHINI GIORGIA	Correlatore

Parole chiave

Chatbot
Deep Learning
Linguaggio naturale
Metodi compressione
Transformer

Data inizio appello

2023-12-12

Disponibilità

Accessibile via web (tutti i file della tesi sono accessibili)

Riassunto analitico

Questa tesi affronta l'evoluzione delle Reti Neurali pre-Transformer (CNN, RNN, LSTM), per poi approfondire l'architettura Transformer evidenziando il ruolo cruciale del meccanismo di multi-head self-attention. Si illustrano applicazioni NLP con modelli Transformer per la definizione di Large Language Models come Bert, GPT, e PaLM, mostrando il ruolo cruciale che questi svolgono nella creazione dei moderni chatbots. Infine, si analizzano alcuni limiti dell’architettura Transformer, in particolare il costo quadratico del meccanismo di attention, e le varianti che sono state proposte al modello originale, concentrandosi in particolare sul modello DCT-Former (che approssima il calcolo dell’attention ricorrendo alla Discrete Cosine Transform).

Abstract

File

Nome file		Dimensione	Tempo di download stimato (Ore:Minuti:Secondi)
Nome file		Dimensione	28.8 Modem	56K Modem	ISDN (64 Kb)	ISDN (128 Kb)	piu' di 128 Kb
	Tesi.pdf	5.61 Mb	00:25:58	00:13:21	00:11:41	00:05:50	00:00:29
Contatta l'autore