
È l’incubo di ogni automobilista: un pedone che si para davanti all’auto apparentemente dal nulla. C’è solo una frazione di secondo per frenare o sterzare per evitare il peggio. Alcune auto oggi sono dotate di sistemi di telecamere che possono avvisare i conducenti o avviare una frenata di emergenza. Ma questi sistemi non sono ancora abbastanza veloci e affidabili per essere utilizzati nei veicoli autonomi.
Daniel Gehrig e Davide Scaramuzza dell’Istituto di Informatica dell’Università di Zurigo (UZH) hanno sviluppato un sistema che combina una nuova telecamera di ispirazione biologica con l’intelligenza artificiale. Questo sistema è in grado di riconoscere gli ostacoli nelle vicinanze di un’automobile molto più velocemente e con meno potenza di calcolo rispetto ai sistemi attuali, come dimostrano i due ricercatori nell’ultimo numero della rivista scientifica Nature.
La maggior parte delle telecamere attuali sono basate sulle immagini: scattano istantanee a intervalli regolari. I sistemi di assistenza alla guida delle auto di solito scattano da 30 a 50 immagini al secondo. Una rete neurale artificiale può essere addestrata a riconoscere gli oggetti in queste immagini, come pedoni, biciclette e altri veicoli. Tuttavia, se accade qualcosa nei 20 o 30 millisecondi che intercorrono tra due istantanee, la telecamera potrebbe riconoscerlo troppo tardi. La soluzione sarebbe quella di aumentare la frequenza dei fotogrammi. Ma questo significa più dati da elaborare in tempo reale e quindi più potenza di calcolo", spiega Daniel Gehrig, autore principale dello studio.
Le telecamere per eventi si basano su un principio diverso: hanno pixel intelligenti che registrano informazioni ogni volta che riconoscono movimenti veloci. In questo modo, non hanno un punto cieco tra le singole immagini e possono riconoscere più rapidamente gli ostacoli. Sono chiamate anche telecamere neuromorfiche perché imitano il modo in cui l’occhio umano percepisce le immagini", spiega Davide Scaramuzza, responsabile del gruppo di ricerca Robotica e Percezione. Tuttavia, hanno anche dei punti deboli: possono trascurare gli oggetti che si muovono lentamente. E le loro immagini non sono così facili da convertire nella forma di dati usuale per l’addestramento dell’algoritmo di intelligenza artificiale.

Gehrig e Scaramuzza hanno combinato il meglio di entrambi i mondi con un sistema ibrido: comprende una telecamera standard che scatta 20 immagini al secondo - un frame rate relativamente basso rispetto alle telecamere attualmente in uso. Le immagini vengono elaborate da un sistema di intelligenza artificiale addestrato a riconoscere auto o pedoni. I dati della telecamera per eventi sono abbinati a un altro tipo di sistema di intelligenza artificiale, particolarmente adatto all’analisi di dati 3D che cambiano nel tempo.
Ciò che la telecamera per eventi vede viene utilizzato per anticipare ciò che la telecamera standard riconosce, al fine di aumentarne le prestazioni. Il risultato è un rilevatore visivo in grado di riconoscere gli oggetti con la stessa velocità di una telecamera standard che scatta 5.000 immagini al secondo. Ma ha bisogno della stessa larghezza di banda di una telecamera standard con 50 immagini al secondo", spiega Daniel Gehrig.
Il team ha testato il sistema rispetto alle migliori telecamere e ai migliori algoritmi visivi attualmente disponibili sul mercato automobilistico. Il risultato: gli eventi vengono rilevati cento volte più velocemente. Allo stesso tempo, la quantità di dati da trasmettere tra la telecamera e il computer di bordo e la potenza di calcolo necessaria per l’elaborazione delle immagini sono ridotte senza compromettere la precisione. Il fattore decisivo è che il sistema è in grado di riconoscere efficacemente le auto e i pedoni che entrano nel campo visivo tra due immagini consecutive della telecamera standard, soprattutto ad alta velocità.
Il metodo potrebbe diventare ancora più potente in futuro se le telecamere venissero integrate con sensori LiDAR, come nelle auto a guida autonoma. Questi sistemi ibridi potrebbero essere fondamentali per garantire la sicurezza necessaria per la guida autonoma senza un aumento significativo dei dati e della potenza di calcolo", afferma Davide Scaramuzza.