Descubre cómo las técnicas de IA de Visión, como la detección de objetos y la estimación de la pose, pueden utilizarse para el seguimiento ocular y la detección de la mirada en diversas aplicaciones.
La visión por ordenador es una rama de la inteligencia artificial (IA) que se centra en capacitar a las máquinas para analizar e interpretar datos visuales de forma similar a los humanos. Una aplicación especialmente fascinante de la IA de visión es la detección de la mirada, que permite a las máquinas seguir y comprender hacia dónde mira una persona.
Como humanos, podemos seguir de forma natural la mirada de alguien y entender en qué se está centrando. Por ejemplo, si estás hablando con un amigo y de repente mira hacia la puerta, puede que instintivamente te gires para ver qué ha captado su atención. Las máquinas, en cambio, no tienen esta capacidad incorporada: hay que entrenarlas mediante técnicas de visión por ordenador para que reconozcan los movimientos oculares e interpreten la dirección de la mirada.
Se prevé que el mercado mundial de la detección de la mirada alcance los 11.900 millones de dólares en 2032, por lo que muchas industrias la están adoptando para distintas aplicaciones. Por ejemplo, la detección de la mirada en los coches se está utilizando para mejorar la seguridad del conductor controlando los niveles de atención y detectando signos de somnolencia o distracción.
En este artículo exploraremos cómo se utiliza la visión por ordenador para el seguimiento ocular y la detección de la mirada. También veremos algunas de sus aplicaciones clave en diversos sectores. Empecemos.
El seguimiento ocular y la detección de la mirada son técnicas utilizadas para determinar el foco de atención de una persona analizando los movimientos oculares y la dirección de la mirada. Gracias a los avances en IA y tecnología de sensores, ahora es posible seguir los ojos de una persona en tiempo real.
Tradicionalmente, la mayoría de los sistemas de seguimiento ocular se basan en cámaras de infrarrojos (IR), que detectan los movimientos de la pupila iluminando los ojos con luz casi infrarroja y captando los reflejos de la córnea. Estos sistemas proporcionan una gran precisión. Sin embargo, a menudo requieren un casco especializado, que puede resultar incómodo de llevar y propenso a problemas de calibración.
Con el auge de la IA, los investigadores han estado explorando activamente métodos de seguimiento ocular basados en la visión por ordenador. A diferencia de los sistemas tradicionales basados en infrarrojos, estos enfoques se basan en modelos de visión por ordenador como Ultralytics YOLO11 para detectar rasgos faciales como los ojos y las pupilas, así como para estimar la posición de la cabeza. Además, hay modelos especializados de aprendizaje profundo, como GazeNet de NVIDIA, diseñados específicamente para la estimación de la mirada.
Aunque todavía es un campo en evolución, el seguimiento de la mirada basado en la visión por ordenador tiene el potencial de hacer más accesible el seguimiento ocular, reduciendo costes y mejorando la usabilidad para aplicaciones en marketing, psicología y neurociencia.
A continuación, exploremos el cambio de los sistemas tradicionales basados en infrarrojos a soluciones más accesibles basadas en software.
Tal vez te preguntes si el seguimiento ocular y la detección de la mirada pueden hacerse sin IA; entonces, ¿por qué se está investigando la integración de la IA y la visión por ordenador en estas tecnologías? Aunque existen métodos tradicionales de seguimiento ocular, a menudo se basan en cámaras infrarrojas especializadas y dispositivos de seguimiento ocular montados en la cabeza, que pueden ser caros, engorrosos y requieren condiciones de iluminación controladas. Las soluciones basadas en IA, sin embargo, permiten el seguimiento ocular utilizando cámaras web estándar y cámaras de smartphone, reduciendo costes y mejorando la accesibilidad.
He aquí otros factores que explican la evolución de la tecnología de seguimiento ocular y detección de la mirada:
Ahora que hemos hablado del papel de la visión por ordenador en el seguimiento ocular y la detección de la mirada, veamos cómo puede utilizarse YOLO11 en este caso.
Ultralytics YOLO11 soporta tareas como la detección de objetos y la estimación de la pose. Preentrenado en el conjunto de datos COCO, consigue una gran precisión en la detección de diversos objetos. En concreto, para una solución de detección de la mirada, YOLO11 puede desempeñar un papel de apoyo.
Aunque no puede predecir directamente la dirección de la mirada, puede afinarse para detectar rostros, ojos y pupilas, que son clave para análisis posteriores. Una vez identificadas estas características, otros modelos pueden procesar los datos de los movimientos oculares para estimar la dirección de la mirada.
Por ejemplo, para mejorar la precisión, YOLO11 puede entrenarse a medida en conjuntos de datos como WIDER FACE para la detección de caras. Además, con respecto a las capacidades de estimación de la pose de YOLO11, puede ayudar a seguir la orientación de la cabeza, lo que mejora la precisión de la detección de la mirada.
La detección de la mirada, posibilitada por la visión por ordenador, tiene una amplia gama de aplicaciones en todos los sectores, desde la mejora de la seguridad en el sector de la automoción hasta el análisis de la atención en los juegos. Exploremos cómo están aprovechando esta tecnología distintos campos.
El seguimiento ocular se está utilizando en los juegos para proporcionar información en tiempo real sobre la concentración, la toma de decisiones y los tiempos de reacción de los jugadores. Mediante el seguimiento de los movimientos oculares, esta tecnología ayuda a los jugadores a perfeccionar sus estrategias, mejora los programas de entrenamiento y aumenta la participación del público mostrando visualmente hacia dónde miran los jugadores en los momentos clave.
Un ejemplo interesante de esto son las carreras de simulación, un deporte de motor virtual competitivo en el que los jugadores corren utilizando simulaciones de conducción realistas. El seguimiento ocular ayuda a analizar cómo los conductores se centran en la pista, reaccionan ante sus oponentes y toman las curvas cerradas. Siguiendo su mirada en tiempo real, los entrenadores pueden identificar patrones, detectar distracciones y mejorar las estrategias de carrera.
Más allá de las carreras de simulación, el seguimiento ocular también se está utilizando en juegos competitivos de ritmo rápido para analizar los reflejos de los jugadores, los tiempos de reacción y cómo se centran en los elementos clave del juego. Al comprender dónde mira un jugador antes de hacer un movimiento, estos datos ayudan a perfeccionar la toma de decisiones, mejorar la precisión y mejorar el entrenamiento para el juego de alto nivel.
Hay muchas aplicaciones de la estimación de la mirada en la IA de la Visión relacionadas con la investigación. Un buen ejemplo es su uso en psicología para estudiar la atención, la carga cognitiva y el comportamiento social. Analizando los movimientos oculares, los investigadores pueden obtener información sobre la percepción, la toma de decisiones y las enfermedades mentales como el autismo y el TDAH.
En concreto, el seguimiento de la mirada mediante visión por ordenador ayuda a identificar patrones en el movimiento ocular, la duración de la fijación y la atención visual, que pueden revelar estados cognitivos y emocionales. Con el avance del aprendizaje profundo y la estimación de la mirada mediante IA, estos métodos son cada vez más precisos y accesibles, lo que permite aplicaciones más amplias en la investigación neurológica.
A lo largo de los años, los investigadores han utilizado distintos métodos para estudiar la atención y el enfoque de los conductores en distintas condiciones de tráfico. Entre estos métodos, el seguimiento ocular ha sido crucial y puede proporcionar información sobre hacia dónde mira el conductor mientras conduce.
Con la ayuda de modelos de visión por ordenador, la detección de la mirada puede mejorar aún más este análisis mediante el seguimiento preciso de los movimientos oculares en tiempo real. Este análisis puede darnos una mejor comprensión del comportamiento del conductor, ayudando a identificar distracciones, fatiga o lapsus de atención, lo que puede mejorar la seguridad vial y ayudar a desarrollar sistemas avanzados de asistencia al conductor.
Por ejemplo, si un conductor aparta con frecuencia la vista de la carretera para consultar su teléfono o reacciona con lentitud en los cruces, el sistema puede detectar estos comportamientos y emitir alertas para que vuelva a centrar su atención, evitando potencialmente accidentes.
He aquí algunas de las principales ventajas que las tecnologías de seguimiento ocular y detección de la mirada pueden aportar a nuestra vida cotidiana:
Aunque estas ventajas ponen de relieve cómo la detección de la mirada puede influir positivamente en nuestras vidas, también es importante tener en cuenta los retos que implica su aplicación. He aquí algunas de las principales limitaciones que hay que tener en cuenta:
El seguimiento ocular y la detección de la mirada, apoyados por modelos de visión por ordenador como YOLO11, están cambiando nuestra forma de interactuar con el mundo. Desde hacer más seguras las carreteras hasta comprender el comportamiento humano, esta tecnología es cada vez más útil en la vida cotidiana.
Aunque existen retos, como la preocupación por la privacidad y la necesidad de ordenadores potentes, los avances en IA y visión por ordenador están haciendo que el seguimiento ocular sea más preciso y fácil de usar. A medida que siga mejorando, es probable que desempeñe un papel más importante en diversos sectores.
Para saber más, visita nuestro repositorio de GitHub y participa en nuestra comunidad. Explora las innovaciones en sectores como la IA en los coches autoconducidos y la visión por ordenador en la agricultura en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y da vida a tus proyectos de Vision AI. 🚀
Comienza tu viaje con el futuro del aprendizaje automático