Riassunto analitico
Toyota nel 2020 ha annunciato la costruzione di Woven City, ovvero una smart city del futuro pensata come un laboratorio vivente in cui si potranno sviluppare e testare tecnologie come la robotica, la mobilità personale, le case intelligenti e l'intelligenza artificiale in un ambiente reale. Uno dei progetti che si implementeranno all’interno di Woven City è un sistema di “physical security”, ovvero un sistema di videocamere di sorveglianza intelligenti in grado di capire quando si verificano delle anomalie nel comportamento delle persone così da segnalare immediatamente l’evento alle autorità competenti, ad esempio risse o furti. Per implementare la physical security è necessario prima riuscire a riconoscere le varie azioni compiute dalle persone (Activity Recognition) per poi individuare quelle anomali. L’Activity Recognition è più semplice se si ha come input la posa della persona, costituita dalle sue giunture (gomiti, spalle, testa, ginocchia, ...), invece che avere direttamente la porzione di immagine in cui vi è la persona (la bounding box). Questo progetto ha come obiettivo l’ottenimento delle pose delle persone (Human Pose Estimation) che verranno date in input all’Activity Recognition. Si è proseguito lo sviluppo del progetto lavorando sul tracciamento delle persone nei video, poiché sarebbe di enorme aiuto per la physical security, in quanto si potrebbero seguire gli spostamenti di quelle persone che hanno commesso dei comportamenti anomali, aiutando ulteriormente le autorità. Oltre all’applicazione all’interno di Woven City, si può usare questo sistema come base per altri progetti, ad esempio il monitoraggio della salute dei lavoratori segnalando posture scorrette durante l’esecuzione di lavori manuali oppure l’ottimizzazione di determinati processi produttivi individuando quanto tempo viene speso in media per eseguire ogni singola fase del processo. Ottenere questo Human Pose Estimation general-purpose con tracking è fondamentale per fornire a Toyota una baseline solida su cui sviluppare molti altri progetti.
|
Abstract
Toyota in 2020 has announced the construction of Woven City, a smart city of the future designed as a living laboratory where technologies such as robotics, personal mobility, smart homes, and artificial intelligence can be developed and tested in a real environment. One of the projects that will be implemented within Woven City is a system of "physical security", i.e. a system of intelligent surveillance cameras able to understand when there are anomalies in the behavior of people so as to immediately report the event to the competent authorities, for example fights or thefts. In order to implement physical security, it is necessary to first recognize the various actions performed by people (Activity Recognition) and then identify the anomalies. The Activity Recognition is easier if you have as input the pose of the person, consisting of its joints (elbows, shoulders, head, knees, ...), instead of having directly the portion of the image in which there is the person (the bounding box). This project aims to obtain the poses of people (Human Pose Estimation) that will be given as input to the Activity Recognition. We continued the development of the project by working on the tracking of people in videos, as it would be of great help for physical security, as you could follow the movements of those people who have committed abnormal behavior, further helping the authorities. In addition to the application within Woven City, you can use this system as the basis for other projects, such as monitoring the health of workers by reporting incorrect postures while performing manual tasks, or optimizing certain manufacturing processes by identifying how much time is spent on average to perform each individual process step. Obtaining this general-purpose Human Pose Estimation with tracking is critical to providing Toyota with a solid baseline on which to develop many other projects.
|