Riassunto analitico
Quando si parla di Big Data si parla letteralmente di una grandissima quantità di dati informativi, che cambiano velocemente e che non si conformano ad un unico formato e che quindi non sono facilmente elaborabili da macchine e tecnologie classiche, ma necessitano di strumenti specifici capaci di estrarre informazioni e renderle utilizzabili, senza perdere a livello computazionale. Lo scopo di questo elaborato è quello di capire come estrarre informazioni rilevanti da dati testuali. Infatti l'ambito di lavoro è la linguistica computazionale, per cui un motore di analisi linguistica riesce ad elaborare un testo e a generare informazioni, le quali sono poi necessarie per estrarre conoscenza sul suddetto testo; ad esempio ricavare l'argomento o le tematiche principali, l'insieme dei personaggi, l'area geografica in cui è ambientata la storia e così via. Allo stesso modo è anche possibile estrarre informazioni importanti da un insieme di parole o espressioni che al motore linguistico sono inizialmente sconosciute. Questo è realizzabile con un sistema in grado di associare ad ogni parola un aggangio alla rete semantica già nota allo strumento di analisi.
|