Verificação verde
Link copiado para a área de transferência

Explora a forma como a visão por computador pode ser utilizada para a deteção do olhar

Descobre como as técnicas de IA de visão, como a deteção de objectos e a estimativa de pose, podem ser utilizadas para o seguimento ocular e a deteção do olhar em várias aplicações.

A visão computacional é um ramo da inteligência artificial (IA) que se concentra em permitir que as máquinas analisem e interpretem dados visuais de uma forma semelhante à dos humanos. Uma aplicação particularmente fascinante da IA de visão é a deteção do olhar, que permite às máquinas seguir e compreender para onde uma pessoa está a olhar.

Como seres humanos, podemos seguir naturalmente o olhar de alguém e perceber em que é que essa pessoa se está a concentrar. Por exemplo, se estiveres a falar com um amigo e ele de repente olhar para a porta, podes instintivamente virar-te para ver o que chamou a sua atenção. As máquinas, por outro lado, não têm esta capacidade incorporada - precisam de ser treinadas utilizando técnicas de visão por computador para reconhecer os movimentos dos olhos e interpretar a direção do olhar. 

Com a previsão de que o mercado global de deteção do olhar atinja 11,9 mil milhões de dólares até 2032, muitas indústrias estão a adoptá-lo para diferentes aplicações. Por exemplo, a deteção do olhar nos automóveis está a ser utilizada para melhorar a segurança dos condutores, monitorizando os níveis de atenção e detectando sinais de sonolência ou distração.

Neste artigo, vamos explorar a forma como a visão por computador é utilizada para o seguimento dos olhos e a deteção do olhar. Também analisaremos algumas das suas principais aplicações em várias indústrias. Toca a começar!

O que é o rastreio ocular e a deteção do olhar?

O seguimento dos olhos e a deteção do olhar são técnicas utilizadas para determinar o foco de atenção de uma pessoa através da análise dos movimentos oculares e da direção do olhar. Graças aos avanços na IA e na tecnologia de sensores, é agora possível seguir os olhos de uma pessoa em tempo real. 

Tradicionalmente, a maioria dos sistemas de rastreio ocular baseia-se em câmaras de infravermelhos (IR), que detectam os movimentos da pupila iluminando os olhos com luz infravermelha próxima e captando os reflexos da córnea. Estes sistemas proporcionam uma elevada precisão. No entanto, muitas vezes requerem um arnês especializado, que pode ser desconfortável de usar e propenso a problemas de calibração.

Com o aumento da IA, os investigadores têm explorado ativamente os métodos de seguimento ocular baseados na visão por computador. Ao contrário dos sistemas tradicionais baseados em IR, estas abordagens baseiam-se em modelos de visão por computador como Ultralytics YOLO11 para detetar caraterísticas faciais, como os olhos e as pupilas, bem como para efetuar a estimativa da pose da cabeça. Além disso, modelos especializados de aprendizagem profunda, como o GazeNet da NVIDIA, são projetados especificamente para a estimativa do olhar. 

Fig. 1. Um exemplo de utilização do YOLO11 para detetar o olho e a pupila de uma pessoa.

Embora ainda seja um campo em evolução, o rastreio do olhar baseado na visão por computador tem o potencial de tornar o rastreio do olhar mais acessível, reduzindo os custos e melhorando a usabilidade para aplicações em marketing, psicologia e neurociência.

A evolução da deteção do olhar e do seguimento do olhar

De seguida, vamos explorar a mudança dos sistemas tradicionais baseados em infravermelhos para soluções mais acessíveis e baseadas em software.

Podes estar a perguntar-te se o seguimento ocular e a deteção do olhar podem ser feitos sem IA - então porque é que há investigação em curso sobre a integração da IA e da visão por computador nestas tecnologias? Embora existam métodos tradicionais de rastreio ocular, estes dependem frequentemente de câmaras de infravermelhos especializadas e de dispositivos de rastreio ocular montados na cabeça, que podem ser dispendiosos, incómodos e requerem condições de iluminação controladas. As soluções baseadas em IA, no entanto, permitem o rastreio ocular utilizando webcams normais e câmaras de smartphones, reduzindo os custos e melhorando a acessibilidade. 

Fig. 2. Um dispositivo de rastreio ocular montado na cabeça.

Eis alguns dos outros factores subjacentes à evolução da tecnologia de seguimento ocular e de deteção do olhar:

  • Aplicações: As abordagens baseadas em software permitem que este espaço se expanda para além da investigação em dispositivos de consumo e áreas como os jogos.
  • Escalabilidade: A IA pode intervir para tornar as soluções de deteção do olhar disponíveis para um público mais vasto, desde utilizadores individuais a indústrias de grande escala.
  • Avanços na tecnologia das câmaras: Hoje em dia, temos acesso a câmaras de smartphone e de webcam de alta resolução que melhoram a precisão do rastreio ocular - algo que não era possível há 20 anos.

Utilização do Ultralytics YOLO11 para deteção e seguimento do olhar

Agora que já discutimos o papel da visão por computador no seguimento dos olhos e na deteção do olhar, vamos ver como YOLO11 pode ser utilizado aqui.

Ultralytics YOLO11 suporta tarefas como a deteção de objectos e a estimativa de pose. Pré-treinado no conjunto de dados COCO, consegue uma elevada precisão na deteção de vários objectos. Especificamente, para uma solução de deteção do olhar, YOLO11 pode desempenhar um papel de apoio. 

Embora não possa prever diretamente a direção do olhar, pode ser aperfeiçoado para detetar rostos, olhos e pupilas, que são fundamentais para uma análise mais aprofundada. Uma vez identificadas estas caraterísticas, modelos adicionais podem processar dados de movimentos oculares para estimar a direção do olhar. 

Por exemplo, para melhorar a precisão, YOLO11 pode ser treinado à medida em conjuntos de dados como o WIDER FACE para a deteção de rostos. Além disso, no que diz respeito às capacidades de estimativa de pose do YOLO11, pode ajudar a seguir a orientação da cabeça, o que melhora a precisão da deteção do olhar.

Fig. 3. YOLO11 pode ser utilizado para detetar rostos humanos.

Aplicações do mundo real da deteção do olhar

A deteção do olhar, possibilitada pela visão por computador, tem uma vasta gama de aplicações em todas as indústrias, desde a melhoria da segurança no sector automóvel até à análise da concentração nos jogos. Vamos explorar como diferentes campos estão a aproveitar esta tecnologia.

Rastreio do olhar nos jogos

O rastreio ocular está a ser utilizado nos jogos para fornecer informações em tempo real sobre a concentração, a tomada de decisões e os tempos de reação dos jogadores. Ao seguir os movimentos dos olhos, esta tecnologia ajuda os jogadores a aperfeiçoar as suas estratégias, melhora os programas de treino e melhora o envolvimento do público ao mostrar visualmente para onde os jogadores estão a olhar durante os momentos-chave.

Um exemplo interessante é a corrida simulada, um desporto automóvel virtual competitivo em que os jogadores correm utilizando simulações de condução realistas. O seguimento do olhar ajuda a analisar a forma como os condutores se concentram na pista, reagem aos adversários e navegam em curvas apertadas. Ao seguir o seu olhar em tempo real, os treinadores podem identificar padrões, detetar distracções e melhorar as estratégias de corrida. 

Fig. 4. O seguimento dos olhos pode ser utilizado para monitorizar e analisar os pilotos de simuladores. 

Para além das corridas simuladas, o seguimento ocular também está a ser utilizado em jogos competitivos de ritmo acelerado para analisar os reflexos dos jogadores, os tempos de reação e a forma como se concentram nos principais elementos do jogo. Ao compreender para onde um jogador olha antes de fazer uma jogada, estes dados ajudam a aperfeiçoar a tomada de decisões, a melhorar a precisão e a melhorar o treino para jogos de alto nível.

Estimativa do olhar para investigação psicológica

Existem muitas aplicações de IA visual da estimativa do olhar relacionadas com a investigação. Um bom exemplo disso é a sua utilização em psicologia para estudar a atenção, a carga cognitiva e o comportamento social. Ao analisar os movimentos dos olhos, os investigadores podem obter informações sobre a perceção, a tomada de decisões e as condições de saúde mental, como o autismo e a PHDA. 

Especificamente, o rastreio do olhar utilizando a visão por computador ajuda a identificar padrões no movimento dos olhos, na duração da fixação e na atenção visual, que podem revelar estados cognitivos e emocionais. Com o avanço da aprendizagem profunda e da estimativa do olhar baseada em IA, estes métodos estão a tornar-se mais precisos e acessíveis, permitindo aplicações mais amplas na investigação neurológica.

Segurança automóvel

Ao longo dos anos, os investigadores têm utilizado diferentes métodos para estudar a atenção e a concentração dos condutores em diferentes condições de trânsito. Entre estes métodos, o rastreio ocular tem sido crucial e pode fornecer informações sobre para onde o condutor está a olhar enquanto conduz. 

Com a ajuda de modelos de visão por computador, a deteção do olhar pode melhorar ainda mais esta análise, acompanhando com precisão os movimentos dos olhos em tempo real. Esta análise pode dar-nos uma melhor compreensão do comportamento do condutor, ajudando a identificar distracções, fadiga ou lapsos de atenção, o que pode melhorar a segurança rodoviária e ajudar no desenvolvimento de sistemas avançados de assistência ao condutor.

Fig. 5. Exemplo de monitorização de um condutor utilizando a deteção do rosto e o seguimento do olhar.

Por exemplo, se um condutor desviar frequentemente o olhar da estrada para ver o telemóvel ou se for lento a reagir nos cruzamentos, o sistema pode detetar estes comportamentos e emitir alertas para reorientar a sua atenção, potencialmente evitando acidentes.

Prós e contras do seguimento ocular e da deteção do olhar

Eis alguns dos principais benefícios que as tecnologias de rastreio ocular e de deteção do olhar podem trazer ao nosso quotidiano:

  • Aumenta a consciencialização: O rastreio ocular fornece informações sobre a forma como as pessoas interagem visualmente com o seu ambiente, ajudando a compreender melhor os padrões de atenção e concentração.
  • Toma melhores decisões: Os dados recolhidos através do rastreio ocular ajudam os investigadores e profissionais a tomar decisões informadas com base em padrões de atenção objectivos.
  • Melhoria da ergonomia visual: A análise do comportamento do olhar pode ajudar a conceber ecrãs, espaços de trabalho e ambientes que reduzam o cansaço visual e melhorem o conforto.

Embora estes benefícios realcem a forma como a deteção do olhar pode ter um impacto positivo nas nossas vidas, também é importante considerar os desafios envolvidos na sua implementação. Aqui estão algumas das principais limitações a ter em conta:

  • Preocupações com a privacidade: O seguimento contínuo dos olhos pode levantar problemas de privacidade, deixando os utilizadores desconfortáveis. Garantir a transparência, o consentimento do utilizador e o processamento local de dados pode ajudar a mitigar estas preocupações.
  • Elevada exigência computacional: O seguimento do olhar em tempo real pode exigir hardware potente, limitando a acessibilidade em dispositivos de baixo consumo. No entanto, os modelos optimizados estão a ajudar a melhorar a eficiência.
  • Limitações de precisão: O seguimento do olhar pode ser menos fiável em ambientes do mundo real devido a alterações de iluminação, movimentos da cabeça ou obstáculos como óculos e cabelo. Os ângulos da câmara também podem afetar o desempenho.

Mantém os olhos no futuro

O seguimento dos olhos e a deteção do olhar, apoiados por modelos de visão por computador como o YOLO11, estão a mudar a forma como interagimos com o mundo. Desde tornar as estradas mais seguras até à compreensão do comportamento humano, esta tecnologia está a tornar-se cada vez mais útil na vida quotidiana.

Embora existam desafios como as preocupações com a privacidade e a necessidade de computadores potentes, os avanços na IA e na visão por computador estão a tornar o seguimento ocular mais preciso e mais fácil de utilizar. À medida que continua a melhorar, é provável que venha a desempenhar um papel mais importante numa série de indústrias.

Para saber mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora inovações em sectores como a IA em carros autónomos e a visão computacional na agricultura nas nossas páginas de soluções. Vê as nossas opções de licenciamento e dá vida aos teus projetos de IA de visão. 🚀

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática