Riassunto analitico
Negli ultimi anni il problema di catalogare e suddividere in base al contenuto grandi quantità di contenuti multimediali ha acquisito sempre più importanza, nello specifico di questa tesi viene affrontato il problema di generare in modo automatizzato descrizioni relative al contenuto di immagini. Una delle peculiarità principali di questo problema è che vi è una connessione ed un uso simultaneo di intelligenza artificiale, visione artificiale ed elaborazione del linguaggio naturale.
In questa tesi viene presentato un modello generativo basato su Reti Neurali Ricorrenti e Convolutive in grado di produrre, in modo automatizzato, la descrizione di un'immagine in linguaggio naturale. Verrà presentata inoltre una tecnica per l'estrazione dei contenuti semantici derivanti dalle immagini e il loro uso durante il ciclo generativo, col fine di produrre una descrizione il più accurata possibile.
|