物体検出や姿勢推定のようなビジョンAI技術が、様々なアプリケーションにおける視線追跡や視線検出にどのように使用できるかをご覧ください。
コンピューター・ビジョンは人工知能(AI)の一分野であり、機械が人間と同様の方法で視覚データを分析・解釈できるようにすることに焦点を当てている。ビジョンAIの特に魅力的なアプリケーションのひとつに視線検出があり、これにより機械は人がどこを見ているかを追跡し理解することが可能になる。
人間であれば、相手の視線を追うことで、相手が何に注目しているのかを自然に理解することができる。例えば、友人と話しているときに相手が突然ドアの方を見た場合、あなたは本能的に相手の注意を引いたものを確認しようと振り向くかもしれない。一方、機械はこのような能力を内蔵していない。目の動きを認識し、視線の方向を解釈するためには、コンピューター・ビジョンの技術を使って訓練する必要がある。
世界の視線検出市場は2032年までに119億ドルに達すると予想されており、多くの産業が様々な用途に視線検出を採用している。例えば、自動車における視線検出は、注意レベルを監視し、眠気や注意散漫の兆候を検出することで、ドライバーの安全性を向上させるために使用されている。
この記事では、視線追跡と視線検出にコンピュータビジョンがどのように使用されているかを探ります。また、様々な業界における主な用途についても見ていきます。さっそく始めましょう!
アイトラッキングと視線検出は、目の動きと視線の方向を分析することによって、人の注意の焦点を決定するために使用される技術です。AIとセンサー技術の進歩により、人の目をリアルタイムで追跡することが可能になった。
従来、ほとんどのアイトラッキングシステムは、近赤外光で眼球を照らし、角膜の反射を捉えることで瞳孔の動きを検出する赤外線(IR)カメラに依存していた。これらのシステムは高い精度を提供する。しかし、特殊なヘッドギアを必要とすることが多く、装着感が悪かったり、キャリブレーションの問題が起こりやすかったりする。
AIの台頭により、研究者たちはコンピュータ・ビジョンに基づく視線追跡方法を積極的に模索している。従来のIRベースのシステムとは異なり、これらのアプローチは、以下のようなコンピュータビジョンモデルに依存している。 Ultralytics YOLO11のようなコンピュータビジョンモデルに依存している。これ以外にも、NVIDIAGazeNetのような特殊なディープラーニングモデルは、視線推定専用に設計されている。
まだ発展途上の分野ではあるが、コンピュータビジョンに基づく視線追跡は、マーケティング、心理学、神経科学などのアプリケーションにおいて、視線追跡をより身近なものにし、コストを削減し、使い勝手を向上させる可能性を秘めている。
次に、従来の赤外線ベースのシステムから、より利用しやすいソフトウェア主導のソリューションへの移行を探ってみよう。
アイトラッキングや視線検出がAIなしでできるのか疑問に思うかもしれないが、なぜAIやコンピュータビジョンをこれらの技術に統合する研究が進められているのだろうか?伝統的な視線追跡方法は存在しますが、多くの場合、特殊な赤外線カメラやヘッドマウント型アイトラッカーデバイスに依存しており、高価で扱いにくく、制御された照明条件を必要とします。しかし、AIを活用したソリューションでは、標準的なウェブカメラやスマートフォンのカメラを使ってアイトラッキングを行うことができるため、コストを削減し、アクセシビリティを向上させることができます。
アイトラッキングと視線検出技術が進化した背景には、他にもいくつかの要因がある:
さて、視線追跡と視線検出におけるコンピュータービジョンの役割について説明してきたが、ここでYOLO11 どのように使うことができるかを説明しよう。
Ultralytics YOLO11 、物体検出や姿勢推定などのタスクをサポートします。COCOデータセットで事前にトレーニングされたYOLO11は、様々な物体の検出において高い精度を達成しています。特に、視線検出ソリューションの場合、YOLO11 11はサポート的な役割を果たすことができます。
視線方向を直接予測することはできないが、さらなる分析の鍵となる顔、目、瞳孔を検出するように微調整することができる。一旦これらの特徴が特定されれば、追加のモデルが眼球運動データを処理して視線方向を推定することができる。
例えば、精度を向上させるために、YOLO11 顔検出用のWIDER FACEのようなデータセットでカスタムトレーニングすることができる。また、YOLO11ポーズ推定機能に関しては、頭の向きを追跡するのに役立ち、視線検出の精度を高めることができる。
コンピュータビジョンによって実現される視線検出は、自動車分野での安全性向上からゲームにおける集中力の分析まで、業界を問わず幅広い用途があります。さまざまな分野で、この技術がどのように活用されているかを探ってみよう。
アイトラッキングは、プレイヤーの集中力、意思決定、反応時間をリアルタイムで把握するためにゲームに利用されています。視線の動きを追跡することで、このテクノロジーはプレーヤーの戦略を洗練させ、トレーニングプログラムを強化し、重要な瞬間にプレーヤーがどこを見ているかを視覚的に表示することで、観客のエンゲージメントを向上させます。
この興味深い例として、シムレーシングが挙げられる。シムレーシングとは、プレイヤーがリアルな運転シミュレーションを使ってレースを行う、競技性の高いバーチャル・モータースポーツである。アイトラッキングは、ドライバーがどのようにコースに集中し、対戦相手に反応し、急カーブを曲がるかを分析するのに役立つ。視線をリアルタイムで追跡することで、トレーナーはパターンを特定し、注意散漫を発見し、レース戦略を改善することができる。
シムレースだけでなく、アイトラッキングはペースの速い対戦型ゲームでも使用され、プレイヤーの反射神経や反応時間、ゲーム内の重要な要素への集中度などを分析しています。プレイヤーが動く前にどこを見ているかを理解することで、このデータは意思決定の洗練、精度の向上、ハイレベルなゲームプレイのためのトレーニングの強化に役立ちます。
視線推定のビジョンAIへの応用は、研究に関連するものが多い。その好例が、注意、認知負荷、社会的行動を研究するための心理学での使用である。視線の動きを分析することで、研究者は知覚、意思決定、自閉症やADHDのような精神衛生状態についての洞察を得ることができる。
具体的には、コンピュータビジョンを用いた視線追跡は、視線の動き、固視時間、視覚的注意のパターンを特定するのに役立ち、認知や感情の状態を明らかにすることができる。ディープラーニングとAIによる視線推定の進歩により、これらの方法はより正確で利用しやすくなり、神経学研究への幅広い応用が可能になりつつある。
長年にわたり、研究者はさまざまな交通状況下でのドライバーの注意力や集中力を研究するために、さまざまな方法を用いてきた。その中でもアイトラッキングは非常に重要であり、ドライバーが運転中にどこを見ているかについての洞察を得ることができる。
コンピュータビジョンモデルの助けを借りて、視線検出はリアルタイムで正確に目の動きを追跡することにより、この分析をさらに改善することができる。この分析により、ドライバーの行動をよりよく理解することができ、注意散漫、疲労、注意力の欠如を特定するのに役立ち、交通安全を向上させ、高度運転支援システムの開発に役立てることができる。
例えば、ドライバーが携帯電話をチェックするために頻繁に道路から目を離したり、交差点での反応が遅かったりする場合、システムはこれらの行動を検出し、注意を集中させるよう警告を発し、事故を防ぐ可能性がある。
ここでは、視線追跡と視線検出技術が私たちの日常生活にもたらす主な利点をいくつか紹介する:
これらの利点は、視線検出が私たちの生活にどのようなプラスの影響を与えることができるかを浮き彫りにする一方で、その実装に伴う課題を考慮することも重要です。以下は、留意すべき主な制限事項である:
YOLO11ようなコンピューター・ビジョン・モデルに支えられたアイトラッキングと視線検出は、私たちと世界との関わり方を変えつつある。道路をより安全にすることから人間の行動を理解することまで、この技術は日常生活でますます役立つようになっている。
プライバシーの問題や強力なコンピュータの必要性といった課題はあるが、AIやコンピュータビジョンの進歩により、アイトラッキングはより正確で使いやすくなっている。今後も改良が進めば、さまざまな業界でより大きな役割を果たすことになるだろう。
詳しくは、GitHub リポジトリをご覧いただき、コミュニティにご参加ください。ソリューションのページでは、自動運転車のAIや 農業のコンピュータビジョンなどの分野におけるイノベーションをご覧いただけます。ライセンスオプションをチェックして、Vision AIプロジェクトを実現しましょう。🚀