Controllo verde
Link copiato negli appunti

Esplorare come la computer vision può essere utilizzata per il rilevamento dello sguardo

Scopri come le tecniche di Vision AI, come il rilevamento degli oggetti e la stima della posa, possono essere utilizzate per il tracciamento degli occhi e il rilevamento dello sguardo in diverse applicazioni.

La computer vision è una branca dell'intelligenza artificiale (AI) che si occupa di consentire alle macchine di analizzare e interpretare i dati visivi in modo simile agli esseri umani. Un'applicazione particolarmente affascinante dell'intelligenza artificiale della visione è il rilevamento dello sguardo, che permette alle macchine di tracciare e capire dove una persona sta guardando.

Come esseri umani, possiamo seguire naturalmente lo sguardo di qualcuno e capire su cosa si sta concentrando. Ad esempio, se stai parlando con un amico e all'improvviso guarda verso la porta, potresti istintivamente girarti per vedere cosa ha attirato la sua attenzione. Le macchine, invece, non hanno questa capacità intrinseca: devono essere addestrate con tecniche di visione computerizzata per riconoscere i movimenti degli occhi e interpretare la direzione dello sguardo. 

Con il mercato globale del rilevamento dello sguardo che dovrebbe raggiungere gli 11,9 miliardi di dollari entro il 2032, molti settori lo stanno adottando per diverse applicazioni. Ad esempio, il rilevamento dello sguardo nelle automobili viene utilizzato per migliorare la sicurezza dei conducenti monitorando i livelli di attenzione e rilevando i segni di sonnolenza o distrazione.

In questo articolo analizzeremo come la computer vision viene utilizzata per il tracciamento degli occhi e il rilevamento dello sguardo. Inoltre, analizzeremo alcune delle sue applicazioni principali in vari settori. Iniziamo!

Che cos'è il tracciamento degli occhi e il rilevamento dello sguardo?

L'eye tracking e il rilevamento dello sguardo sono tecniche utilizzate per determinare l'attenzione di una persona analizzando i movimenti degli occhi e la direzione dello sguardo. Grazie ai progressi dell'intelligenza artificiale e della tecnologia dei sensori, oggi è possibile tracciare gli occhi di una persona in tempo reale. 

Tradizionalmente, la maggior parte dei sistemi di eye-tracking si basa su telecamere a infrarossi (IR), che rilevano i movimenti della pupilla illuminando gli occhi con una luce vicina all'infrarosso e catturando i riflessi della cornea. Questi sistemi offrono un'elevata precisione. Tuttavia, spesso richiedono un copricapo speciale, che può essere scomodo da indossare e soggetto a problemi di calibrazione.

Con l'avvento dell'intelligenza artificiale, i ricercatori hanno esplorato attivamente i metodi di tracciamento oculare basati sulla computer vision. A differenza dei sistemi tradizionali basati sull'IR, questi approcci si basano su modelli di visione computerizzata quali Ultralytics YOLO11 per rilevare le caratteristiche del viso, come gli occhi e le pupille, e per eseguire la stima della posa della testa. Inoltre, modelli specializzati di deep learning come GazeNet di NVIDIA sono progettati specificamente per la stima dello sguardo. 

Figura 1. Un esempio di utilizzo di YOLO11 per rilevare l'occhio e la pupilla di una persona.

Sebbene sia ancora un campo in evoluzione, il tracciamento dello sguardo basato sulla visione computerizzata ha il potenziale per rendere il tracciamento degli occhi più accessibile, riducendo i costi e migliorando l'usabilità per applicazioni nel marketing, nella psicologia e nelle neuroscienze.

L'evoluzione del rilevamento dello sguardo e del tracciamento degli occhi

Esploriamo poi il passaggio dai tradizionali sistemi a infrarossi a soluzioni più accessibili e basate su software.

Forse ti starai chiedendo se il tracciamento degli occhi e il rilevamento dello sguardo possono essere effettuati senza l'IA, e allora perché sono in corso ricerche per integrare l'IA e la computer vision in queste tecnologie? Sebbene esistano metodi tradizionali di eye-tracking, spesso si basano su telecamere a infrarossi specializzate e dispositivi head-mounted eye tracker, che possono essere costosi, ingombranti e richiedono condizioni di illuminazione controllata. Le soluzioni basate sull'intelligenza artificiale, invece, consentono di tracciare gli occhi utilizzando normali webcam e fotocamere di smartphone, riducendo i costi e migliorando l'accessibilità. 

Figura 2. Un dispositivo head-mounted eye tracker.

Ecco alcuni degli altri fattori alla base dell'evoluzione della tecnologia di eye tracking e di rilevamento dello sguardo:

  • Applicazioni: Gli approcci basati sul software consentono a questo spazio di espandersi oltre la ricerca in dispositivi di consumo e in settori come il gioco.
  • Scalabilità: L'intelligenza artificiale può intervenire per rendere le soluzioni di rilevamento dello sguardo disponibili a un pubblico più ampio, dai singoli utenti alle grandi industrie.
  • I progressi nella tecnologia delle fotocamere: Oggi abbiamo accesso a fotocamere di smartphone e webcam a più alta risoluzione che migliorano l'accuratezza del tracciamento oculare, cosa che non era possibile fare 20 anni fa.

Utilizzo di Ultralytics YOLO11 per il rilevamento dello sguardo e il tracciamento degli occhi

Ora che abbiamo parlato del ruolo della computer vision nel tracciamento degli occhi e nel rilevamento dello sguardo, vediamo come YOLO11 può essere utilizzato in questo caso.

Ultralytics YOLO11 supporta compiti come il rilevamento di oggetti e la stima della posa. Pre-allenato sul set di dati COCO, raggiunge un'elevata precisione nel rilevamento di vari oggetti. In particolare, per una soluzione di rilevamento dello sguardo, YOLO11 può svolgere un ruolo di supporto. 

Sebbene non sia in grado di prevedere direttamente la direzione dello sguardo, può essere messo a punto per rilevare volti, occhi e pupille, che sono fondamentali per ulteriori analisi. Una volta identificate queste caratteristiche, ulteriori modelli possono elaborare i dati del movimento oculare per stimare la direzione dello sguardo. 

Ad esempio, per migliorare l'accuratezza, YOLO11 può essere addestrato su set di dati come WIDER FACE per il rilevamento dei volti. Inoltre, per quanto riguarda le capacità di stima della posa, YOLO11 può aiutare a tracciare l'orientamento della testa, migliorando l'accuratezza del rilevamento dello sguardo.

Figura 3. YOLO11 può essere utilizzato per rilevare i volti umani.

Applicazioni del mondo reale del rilevamento dello sguardo

Il rilevamento dello sguardo, grazie alla computer vision, ha un'ampia gamma di applicazioni in tutti i settori, dal miglioramento della sicurezza nel settore automobilistico all'analisi dell'attenzione nei giochi. Vediamo come diversi settori stanno sfruttando questa tecnologia.

Tracciamento dello sguardo nei giochi

Il tracciamento degli occhi viene utilizzato nei giochi per fornire informazioni in tempo reale sull'attenzione, il processo decisionale e i tempi di reazione dei giocatori. Tracciando i movimenti degli occhi, questa tecnologia aiuta i giocatori a perfezionare le loro strategie, migliora i programmi di allenamento e migliora il coinvolgimento del pubblico mostrando visivamente dove guardano i giocatori nei momenti chiave.

Un esempio interessante è il sim racing, uno sport automobilistico virtuale competitivo in cui i giocatori gareggiano con simulazioni di guida realistiche. Il tracciamento degli occhi aiuta ad analizzare il modo in cui i piloti si concentrano sulla pista, reagiscono agli avversari e affrontano le curve più strette. Tracciando lo sguardo in tempo reale, gli istruttori possono identificare gli schemi, individuare le distrazioni e migliorare le strategie di gara. 

Figura 4. Il tracciamento degli occhi può essere utilizzato per monitorare e analizzare i piloti di simulazione. 

Oltre alle corse simulate, il tracciamento oculare viene utilizzato anche nei giochi competitivi ad alta velocità per analizzare i riflessi dei giocatori, i tempi di reazione e il modo in cui si concentrano sugli elementi chiave del gioco. Capendo dove un giocatore guarda prima di fare una mossa, questi dati aiutano a perfezionare il processo decisionale, a migliorare la precisione e a migliorare l'allenamento per un gioco di alto livello.

Stima dello sguardo per la ricerca psicologica

Esistono molte applicazioni di Vision AI della stima dello sguardo legate alla ricerca. Un buon esempio è il suo utilizzo in psicologia per studiare l'attenzione, il carico cognitivo e il comportamento sociale. Analizzando i movimenti oculari, i ricercatori possono ottenere informazioni sulla percezione, sul processo decisionale e sulle condizioni di salute mentale come l'autismo e l'ADHD. 

In particolare, il tracciamento dello sguardo tramite la computer vision aiuta a identificare i modelli di movimento degli occhi, la durata della fissazione e l'attenzione visiva, che possono rivelare stati cognitivi ed emotivi. Con il progresso dell'apprendimento profondo e della stima dello sguardo guidata dall'intelligenza artificiale, questi metodi stanno diventando più precisi e accessibili, consentendo applicazioni più ampie nella ricerca neurologica.

Sicurezza automobilistica

Nel corso degli anni, i ricercatori hanno utilizzato diversi metodi per studiare l'attenzione e la concentrazione dei conducenti in diverse condizioni di traffico. Tra questi metodi, il tracciamento oculare è stato fondamentale e può fornire indicazioni su dove il conducente sta guardando durante la guida. 

Con l'aiuto di modelli di visione computerizzata, il rilevamento dello sguardo può migliorare ulteriormente questa analisi, tracciando con precisione i movimenti oculari in tempo reale. Questa analisi può darci una migliore comprensione del comportamento del guidatore, aiutandoci a identificare distrazioni, stanchezza o cali di attenzione, il che può migliorare la sicurezza stradale e contribuire allo sviluppo di sistemi avanzati di assistenza alla guida.

Figura 5. Un esempio di monitoraggio di un conducente tramite il rilevamento del volto e il tracciamento dello sguardo.

Ad esempio, se un conducente distoglie spesso lo sguardo dalla strada per controllare il telefono o è lento a reagire agli incroci, il sistema è in grado di rilevare questi comportamenti ed emettere avvisi per riorientare l'attenzione, evitando potenzialmente incidenti.

Pro e contro del tracciamento degli occhi e del rilevamento dello sguardo

Ecco alcuni dei principali vantaggi che le tecnologie di eye-tracking e di rilevamento dello sguardo possono apportare alla nostra vita quotidiana:

  • Maggiore consapevolezza: L'eye tracking fornisce informazioni su come le persone interagiscono visivamente con l'ambiente circostante, aiutando a comprendere meglio i modelli di attenzione e concentrazione.
  • Migliorare il processo decisionale: I dati raccolti dal tracciamento oculare aiutano i ricercatori e i professionisti a prendere decisioni informate sulla base di modelli di attenzione oggettivi.
  • Miglioramento dell'ergonomia visiva: L'analisi del comportamento dello sguardo può aiutare a progettare schermi, spazi di lavoro e ambienti che riducono l'affaticamento degli occhi e migliorano il comfort.

Se da un lato questi vantaggi evidenziano come il rilevamento dello sguardo possa avere un impatto positivo sulla nostra vita, dall'altro è importante considerare le sfide che comporta la sua implementazione. Ecco alcune delle principali limitazioni da tenere a mente:

  • Privacy: Il tracciamento continuo degli occhi può sollevare problemi di privacy, mettendo a disagio gli utenti. Garantire la trasparenza, il consenso dell'utente e l'elaborazione locale dei dati può aiutare a mitigare questi problemi.
  • Elevata richiesta computazionale: Il tracciamento dello sguardo in tempo reale può richiedere un hardware potente, limitando l'accessibilità ai dispositivi a basso consumo. Tuttavia, i modelli ottimizzati stanno contribuendo a migliorare l'efficienza.
  • Limiti di precisione: Il tracciamento dello sguardo può essere meno affidabile in ambienti reali a causa dei cambiamenti di luce, dei movimenti della testa o di ostacoli come occhiali e capelli. Anche l'angolazione della telecamera può influire sulle prestazioni.

Tenere gli occhi puntati sul futuro

Il tracciamento degli occhi e il rilevamento dello sguardo, supportati da modelli di computer vision come YOLO11, stanno cambiando il modo in cui interagiamo con il mondo. Dal rendere le strade più sicure alla comprensione del comportamento umano, questa tecnologia sta diventando sempre più utile nella vita di tutti i giorni.

Anche se ci sono sfide come i problemi di privacy e la necessità di computer potenti, i progressi nell'IA e nella computer vision stanno rendendo il tracciamento oculare più preciso e più facile da usare. Con il continuo miglioramento di questa tecnologia, è probabile che svolga un ruolo sempre più importante in una serie di settori.

Per saperne di più, visita il nostro repository GitHub e partecipa alla nostra comunità. Esplora le innovazioni in settori come l'IA nelle auto a guida autonoma e la computer vision in agricoltura sulle nostre pagine dedicate alle soluzioni. Scopri le nostre opzioni di licenza e dai vita ai tuoi progetti di Vision AI. 🚀

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico