Riassunto analitico
La tesi realizzata tratta la classificazione di privacy policy attraverso algoritmi di machine learning. In particolare, sono stati utilizzati l'algoritmo di support vector machine, le random forest, le reti neurali convoluzionalie le reti neurali gated recurrent units. L'elaborato è costituito da due parti principali. La prima parte è prettamente teorica e fornisce innanzitutto le principali informazioni riguardo le privacy policy e l'ambito del machine learning, concentrandosi in particolare sulla classificazione. Inoltre, sono descritti teoricamente gli algoritmi utilizzati durante la fase sperimentale. La seconda parte della tesi descrive invece il lavoro sperimentale e i risultati ottenuti. Nella prima sezione sono descritti il software e il dataset utilizzati, i meccanismi e le strategie addottate, le caratteristiche degli algoritmi utilizzati. Nella seconda parte sono invece descritti e presentati i risultati ottenuti ed è realizzato un confronto tra i risultati dei diversi modelli per ciascuna etichetta caratterizzante le privacy policy.
|
Abstract
The thesis is about classification of privacy policies thorugh machine learning algorithms. In particular, the following algorithms was used: support vector machine, random forest, convolutional neural networks, gated recurrent units neural networks. The thesis is composed by two main parts. The first one is purely theoretical and it gives the main informations about privacy policies and machine learning field, focusing in particular on the automated classification. The second part of the thesis describes the experimental work and the obtained results. The first section describes the used software anche dataset, the adopted mechanisms and strategies, the characteristics of the used algorithms. On the other hand, the second section describes and shows the obtained results and it realizes a comparison among the results of the different models for each label characterizing the privacy policies.
|