Riassunto analitico
Le informazioni sulla profondità sono importanti per i sistemi di guida autonoma perché permettono di percepire l’ambiente circostante e stimare il proprio stato all’interno di esso. I sensori che vengono utilizzati per acquisire informazioni nei veicoli sono veramente tanti e la varietà di misurazioni acquisite include velocità, posizione, profondità e altro. Queste misurazioni vengono inserite in un sistema di feedback che addestra e utilizza modelli di movimento che il veicolo deve rispettare. Questa tesi si concentra appunto sulla stima della profondità. Prima di tutto verranno presentate le attuali reti allo stato dell'arte per la stima della profondità da una singola immagine RGB. A tale scopo, le reti BTS (From Big to Small) e DenseDepth sono state prese in considerazione per vari motivi che verranno poi analizzati in dettaglio in seguito. Infine, poiché la percezione consiste in diversi compiti, verrà esaminata la possibilità di eseguire più compiti contemporaneamente attraverso l'uso di Detectron2, un sistema di rilevamento di oggetti open source di Facebook AI Research [Yuxin Wu, Alexander Kirillov Francisco Massa, Wan-Yen Lo, and Ross Girshick. 2019. Detectron2. https://github.com/facebookresearch/detectron2], che dà la possibilità di eseguire il rilevamento di oggetti, rilevamento dei punti chiave (keypoints detection), segmentazione delle istanze, segmentazione semantica e densepose simultaneamente. Il lavoro svolto consiste nell'aggiungere la testa di stima della profondità per poi utilizzare un dataset sintetico per addestrare simultaneamente le teste di object detection, segmentazione semantica e stima della profondità, per poi valutare le differenze di prestazioni e accuratezza rispetto ai risultati ottenuti dall'addestramento di singole teste.
|