Riassunto analitico
Oggigiorno i social network rappresentano il luogo principale dove persone ed entità interagiscono, condividendo i propri pensieri, e creando di conseguenza vere e proprie discussioni virtuali. Pertanto, i dati generati dagli utenti dei social network, se filtrati e contestualizzati, risultano una miniera di informazioni. Twitter, durante la pandemia Covid-19, ha avuto un ruolo fondamentale per lo scambio di idee, la divulgazione di notizie e rimanere aggiornati sull’andamento della pandemia. È stato anche luogo di forte dibattito sulle normative introdotte dal governo, per esempio il Certificato Verde, e sulla questione dei vaccini contro il virus. Grazie alle analisi condotte all’interno di questa tesi, è stato possibile identificare le figure che hanno avuto un ruolo centrale nella scena di twitter durante la pandemia, quindi quegli utenti i cui tweet hanno ottenuto un pubblico maggiore, influendo le idee altrui in modo più incisivo. Per la ricerca di questi utenti, sono stati utilizzati algoritmi di ranking, tra cui il PageRank, il PersonalizedPageRank e l’algoritmo di Degree Centrality. A questi algoritmi è stato fornito un peso, composto dal numero di interazioni e like ottenuti dai tweet degli utenti. Con il numero di like si è voluto rappresentare l’apprezzamento e l’importanza che un utente ha ottenuto, attraverso i suoi tweet, dagli altri utenti. Identificati gli utenti più influenti, grazie all’utilizzo di tecniche di Text Analytics, è stato possibile effettuare l’analisi psicolinguistica dei loro tweet. Da questa analisi è stato possibile ricavare le emozioni con le quali gli utenti hanno affrontato la pandemia e quali sono stati gli argomenti trattati per la maggiore; alcune sotto-categorie linguistiche hanno permesso di definire gruppi di utenti con idee affini nei confronti di vaccini, Green Pass e restrizioni. Attraverso l’uso di algoritmi di community detection è stato possibile capire se utenti con caratteristiche simili appartengono alla stessa comunità. I dati sui quali si sono fatte le analisi si riferiscono al periodo Marzo 2020 - Dicembre 2021, e grazie alla creazione di scaglioni temporali della durata di un mese, è stato possibile analizzare il cambiamento dei risultati delle analisi al passare dei mesi.
|
Abstract
Today social networks represent the main place where people and entities interact, sharing their thoughts, and consequently creating real virtual discussions. Therefore, the data generated by users of social networks, if filtered and contextualized, are a mine of information. Twitter, during the Covid-19 pandemic, played a fundamental role in exchanging ideas, disseminating news and staying updated on the progress of the pandemic. It was also a place of intense debate on the regulations introduced by the government, for example the Green Certificate, and on the issue of vaccines against the virus. Thanks to the analyzes conducted within this thesis, it was possible to identify the figures who played a central role in the twitter scene during the pandemic, therefore those users whose tweets have obtained a greater audience, influencing the ideas of others more incisive. To search for these users, ranking algorithms were used, including PageRank, PersonalizedPageRank and Degree Centrality algorithm. A weight was given to these algorithms, consisting of the number of interactions and likes obtained from users' tweets. With the number of likes, we wanted to represent the appreciation and importance that a user has obtained, through his tweets, from other users. Once the most influential users had been identified, thanks to the use of Text Analytics techniques, it was possible to carry out the psycholinguistic analysis of their tweets. From this analysis it was possible to derive the emotions with which the users faced the pandemic and which were the topics dealt with the most; some linguistic sub-categories made it possible to define groups of users with similar ideas regarding vaccines, Green Passes and restrictions. Through the use of community detection algorithms it was possible to understand if users with similar characteristics belong to the same community. The data on which the analyzes were made refer to the period March 2020 - December 2021, and thanks to the creation of time brackets lasting one month, it was possible to analyze the change in the results of the analyzes over the months.
|