Riassunto analitico
In un contesto attuale sempre più votato alla valorizzazione dei dati come risorsa primaria, il federated learning emerge come risorsa innovativa per garantire una cooperazione efficace tra diverse entità, con lo scopo di condividere conoscenze pur mantenendo intatta la riservatezza (e quindi il valore) dei dati individuali. Il federated learning si pone come un approccio decentrato che trasferisce l'onere computazionale dell'addestramento dei modelli direttamente sui dispositivi on-edge, riducendo la necessità di trasferire grandi quantità di dati a server centralizzati. Questa decentralizzazione consente di preservare la privacy dei dati, poiché i dati rimangono localmente sui dispositivi degli utenti e vengono elaborati in loco. Inoltre, questo approccio favorisce una maggiore scalabilità e flessibilità, consentendo di adattarsi a una vasta gamma di scenari e applicazioni. Questo approccio presenta anche diverse sfide, al netto delle potenzialità citate in precedenza, tra cui la gestione dell’eterogeneità dei dati, oltre che dei dispositivi e la sicurezza della comunicazione tra le diverse entità, tutto questo garantendo il massimo trade-off tra privacy dei dati e prestazioni del modello finale. In questo elaborato verranno trattate le principali tecniche di federated learning, che saranno confrontate attraverso use-case reali con l’obiettivo finale di applicare le conoscenze acquisite per sviluppare un modello federato in grado di predirre il numero di persone presenti in un certo luogo e ad una certa ora, sfruttando le conoscenze acquisite dalle telecamere MASA e dalle celle telefoniche TIM.
|
Abstract
In a current context increasingly focused on the valorization of data as a primary resource, federated learning emerges as an innovative resource to guarantee effective cooperation between different entities, with the goal of sharing knowledge while keeping the confidentiality (and therefore the value) of individual data intact.
Federated learning is a decentralized approach that transfers the computational burden of model training directly to on-edge devices, reducing the need to transfer large amounts of data to centralized servers. This decentralization allows for data privacy to be preserved, as data remains locally on user devices and is processed in place. Furthermore, this approach promotes greater scalability and flexibility, allowing it to adapt to a wide range of scenarios and applications.
However, this approach also presents several challenges, despite the aforementioned potential, including the management of data heterogeneity, as well as devices and the security of communication between different entities, all while ensuring the maximum trade-off between data privacy and final model performance.
This thesis will discuss the main techniques of federated learning, which will be compared through real use cases with the ultimate goal of applying the acquired knowledge to develop a federated model capable of predicting the number of people in a certain place and at a certain time, exploiting the knowledge acquired from MASA cameras and TIM cell towers.
|