Riassunto analitico
Il recente avvento dei primi prototipi di veicoli a guida autonoma ha messo in evidenza alcune delle numerose sfide che devono essere affrontate per rendere possibile la guida autonoma senza supervisione umana. Una tra queste è la percezione dell'ambiente circostante da parte del veicolo. I sensori di bordo del veicolo possono non essere sempre sufficienti in tutte le condizioni di visibilità, in particolare in presenza di incroci con scarsa visibilità dove i veicoli non sono in grado di sfruttare aiuti visivi a disposizione del guidatore umano come gli specchi stradali. Nell'ottica delle smart cities e veicoli connessi, questo aspetto può essere migliorato mediante l'utilizzo di telecamere a circuito chiuso presenti nella città. Queste telecamere godono di un punto di vista rialzato rispetto alle telecamere di bordo dei veicoli e possono coprire angoli ciechi e incroci con scarsa visibilità fornendo ai veicoli connessi un analogo aiuto visivio. In questa tesi è trattato il problema di Monocular 3D Detection and Pose Estimation in ambito automotive. Il suddetto problema consiste nella identificazione e stima della posizione degli attori della strada (pedoni, ciclisti, veicoli) nello spazio tridimensionale servendosi unicamente di telecamere singole, da cui il termine monocular. Il punto di vista rialzato di queste telecamere penalizza l'efficacia delle principali soluzioni open source e liberamente accessibili in ambito automotive, progettate per il funzionamento con una prospettiva a livello del veicolo. L'obbiettivo di questa tesi è migliorare le capacità di rilevazione e stima della posizione degli attori della strada da questa differente prospettiva appena descritta.
|