Riassunto analitico
Il progetto sviluppato in questa tesi nasce da un’esigenza reale: cercare di fornire assistenza ad una persona anziana sola in casa con tecniche di visione artificiale e machine learning. L’assistenza semiautomatica di persone sole ed anziane è una problematica molto frequente in Italia, dove il tasso di anzianità (rapporto tra la popolazione over 65 e la popolazione di età compresa tra 0 e 14 anni, moltiplicato per 100) è in continuo aumento, passando da un 144.1% nel 2009 ad un 172.9% nel 2019 [dati Istat]. Il sistema proposto è stato sviluppato cercando, in primo luogo, di individuare e riconoscere nel tempo un soggetto principale da esaminare, definito a priori, tra un possibile insieme di persone presenti in un ambiente indoor. La scena è delimitata ed osservata da uno o più sensori RGB-D, in grado di ovviare alle lacune di una classica telecamera RGB, aggiungendo un sensore attivo di profondità (ovvero basato su illuminatore e sensore ad infrarossi), permettendo così uno studio agevole anche in ambiente notturno. Inoltre, le immagini range ottenute dai sensori RGB-D sono in grado di fornire informazioni metriche sullo spazio tridimensionale acquisito. Oltre a definire una corretta procedura per la detection e il tracking di soggetti, è stato studiato un framework per lo studio delle azioni compiute dal soggetto in esame e l’interazione con l’ambiente e gli oggetti presenti, in modo da rilevare e comunicare eventuali azioni ritenute anomale o distanti da un comportamento definito “normale”.
|
Abstract
The project developed in this thesis is born from a real need: try to help an elderly person that lives alone, using Computer Vision and Machine Learning techniques. The semi-automatic assistance of lonely and elderly people it’s a very frequent problem in Italy, where the “seniority rate” (ratio between over 65 people and people with age in range 0-14, multiplied by 100) it’s constantly increasing, passing from 144.1% in the 2009, to a 172.9% in the 2019 [1].
First of all, the proposed system has been developed trying to locate and recognize a main subject from a possible set of people in an indoor environment, over time. The scene is delimited and observed by one or more RGB-D sensors that can solve the shortcomings of a classic RGB camera, adding an active depth sensor (based on an illuminator and an infrared sensor). Thanks to the infrared channel, it’s possible to study the environment even in night situations. Moreover, range images obtained by the RGB-D sensors are able to provide metric informations on the three-dimensional space acquired.
In addition to defining a correct procedure for people detection and tracking, has been studied a framework in order to understand actions performed by the main subject in the scene and also interactions between the “protagonist” and the environment or interesting objects in the environment. The purpose of this approach is to detect and communicate those actions deemed as abnormal actions or distant with respect to a “normal behavior”.
|