グリーンチェック
クリップボードにコピーされたリンク

行動AIがコンピュータービジョンをよりインパクトのあるものにする

デビッド・スコット氏(YOLO Vision 2024)の基調講演「AIを活用した行動分析と畜産分野での実際の応用」を再確認しましょう。

長年にわたり、コンピュータ・ビジョンの技術革新は、画像やビデオ内の犬や車などの物体を識別する物体検出などのタスクに焦点を当ててきた。これらのアプローチは、自律走行車、製造、ヘルスケアなどの分野での応用を可能にしてきた。 

しかし、このようなタスクは、物体が何であるかを識別することだけに焦点を当てることが多い。ビジョンAIシステムが、さらに一歩進んだことができるとしたらどうだろう?例えば、単に犬を検出するのではなく、犬がボールを追いかけていることや、歩行者が横断しているために車が急ブレーキをかけていることを理解できるとしよう。基本的な認識から文脈理解へのシフトは、より賢く、文脈を認識した行動AIへの大きな転換を意味する。

YOLO Vision 2024(YV24)、Ultralytics'ビジョンAIの進歩を祝う年次ハイブリッド・イベントでは、The Main BranchのCEOであるDavid Scott氏による興味深い講演の中で、AI主導の行動分析というコンセプトが中心となった。

デイビッドは講演で、基本的なコンピューター・ビジョン・タスクから行動追跡への移行について探求した。25年以上にわたる最先端技術アプリケーションの構築経験を持つ彼は、この飛躍がもたらす影響を紹介した。彼は、パターンや行動を解読することが、農業や動物福祉のような産業をどのように再構築しているかを強調した。

この記事では、デイビッドの講演のハイライトを紹介し、行動追跡がAIをより実用的なものにする方法を探る。 

AI導入の課題を理解する

デビッド・スコットは基調講演の冒頭で、大胆な現実確認をしてこう言った。私の同僚がよく『科学は売れない』と言っている。AIは本当にクールだ。なぜ人々はそれを買わないのだろう?しかし、現実には、私たちがクールだと思うからといって、人々はそれを買いたがらない。

さらに彼は、彼の会社であるメインブランチでは、単にAIの能力を誇示するのではなく、常に現実の問題をAIで解決することに重点を置いていると説明した。多くのクライアントが、AIを一般的にどのように活用できるかを話したがっているが、彼はそれを後ろ向きのアプローチだと考えている。そうではなく、具体的な課題を持ってくるクライアントと一緒に仕事をすることで、実際に変化をもたらすAIソリューションを生み出すことができるのだ。

図1.YV24のステージに立つデビッド・スコット。

デイビッドはまた、彼らの仕事はしばしばシーン内の物体を認識するだけにとどまらないと話した。そこにあるものを見つけることは最初のステップに過ぎない。本当の価値は、その情報を使って何をすべきかを考え、より大きな価値連鎖の中でそれを役立てることから生まれる。 

行動追跡テクノロジー:実用的AIへの鍵

AIを真に有用なものにするための重要なステップは、物体検出のような基本的なコンピューター・ビジョンのタスクを超えて、それらの洞察を行動追跡に利用することだ。デイビッドは、行動AIは単に物体を識別するだけでなく、行動やパターンを理解することに重点を置いていると強調した。これにより、AIは意味のある出来事を認識し、実用的な洞察を提供できるようになる。

彼は、動物が床に転がるのは病気を示している可能性があるという例を挙げた。人間は24時間体制で動物を監視することはできないが、行動追跡機能を備えたAI主導の監視システムなら可能だ。このようなソリューションは、対象物を継続的に監視し、特定の行動を検出し、アラートを送信し、タイムリーな行動を可能にする。これにより、生のデータが実用的で価値のあるものに変わる。

デイビッドはまた、このアプローチがAIを単に興味深いものにするだけでなく、真にインパクトのあるものにすると紹介した。行動を監視し、それに基づいて行動するというような現実的な問題に取り組むことで、行動追跡はさまざまな業界にわたる効果的なAIソリューションの重要な部分になり得る。

行動AIを実現する

続いてデビッド・スコットが Ultralytics YOLOv8コンピュータ・ビジョン・モデルは、彼のチームの行動追跡プロジェクトにとって画期的なものだった。これは、物体を検出し、分類し、追跡するための強固な基礎を与えた。また、彼のチームはさらに一歩進んで、 YOLOv8 を カスタム・トレーニングし、時間の経過とともに行動を監視することに集中させ、より実用的で実世界の状況に役立つようにした。

興味深いことに Ultralytics YOLO11のリリースにより、The Main Branchのようなソリューションの信頼性と精度がさらに向上した。この最新モデルは、精度の向上や処理の高速化といった機能を提供し、行動を追跡する能力を高めている。この点については、行動AIがどのような用途に使用できるかを理解した上で、さらに詳しく説明することにしよう。

次に、デイビッドが語ったソリューションと、行動追跡技術が日常的な課題を解決し、有意義なインパクトを与えるために、実際のアプリケーションでどのように使われているかを探ってみよう。

AIによる行動分析が可能なHerdSense

まずデイビッドは、大規模な肥育場で何千頭もの牛の健康状態をモニタリングするHerdSenseと呼ばれるプロジェクトで取り組んだエキサイティングな挑戦について話した。目標は、個々の牛の行動を追跡し、潜在的な健康問題を特定することだった。これは何万頭もの牛を同時に監視することを意味し、簡単な作業ではなかった。

図 2.HerdSense は行動 AI を使って牛をモニタリングし、特定することに重点を置いていた。

それぞれの牛を特定し、その行動を追跡するという問題を解決するため、デイビッドのチームは2日間のワークショップを開き、モニタリングに必要なあらゆる行動の概要を説明した。彼らは合計200以上の行動を特定した。

すべてのデータを特定の牛に関連付ける必要があるため、200 の行動のどれもが、個々の牛を正確に認識できるかどうかにかかっていました。大きな懸念事項の1つは、牛が群れをなして集団行動をしているときに牛を追跡することで、個々の牛を確認することが難しくなった。 

デビッドのチームは、トリッキーな状況でも牛を確実に識別できるコンピューター・ビジョン・システムを開発した。彼らは、同じ牛が視界から消えても、他の牛と混ざっても、後で再び現れても、常に同じIDが割り当てられることを確認できた。

コンピュータビジョンによる馬の健康モニタリング

デイビッドは、同様の行動追跡技術を馬のモニタリングに応用した、もうひとつの魅力的なプロジェクトを紹介した。このプロジェクトでは、牛のように個々の馬のIDを細かく追跡 する必要はなかった。その代わり、特定の行動に焦点を当て、食事パターンや一般的な活動レベルなどの詳細を追跡し、健康上の問題を早期に発見することにした。行動の小さな変化を特定することで、より良いケアを提供し、問題が深刻化する前に予防するための迅速な介入につながる可能性がある。

図3.行動AIによる馬のモニタリング。

行動AIが見かけほど単純でない理由

デビッドはまた、興味深い例を通して行動追跡の複雑さについても語った。行動分析を改善する方法を研究しているとき、彼のチームは、誰かがポケットに手を入れているような特定のポーズを分析することによって万引きを検出すると主張する会社に出会った。最初は、これは賢いアイデアに思えた。特定の動作が疑わしい行動を示唆する可能性がある、そうだろう?

図4.行動追跡技術の課題を理解する

しかし、デビッドはさらに調査を進めるうちに、この方法の限界に気づいた。ポケットに手を突っ込むようなポーズひとつとっても、必ずしも万引きをしているとは限らない。リラックスしていたり、考え事をしていたり、あるいは寒そうにしているだけかもしれない。単独のポーズに注目することの問題点は、より大きな文脈を無視してしまうことだ。行動とは、単にひとつの行動ではなく、文脈や意図によって形成された、時間をかけた行動のパターンなのだ。

デイビッドは、真の行動追跡ははるかに複雑で、全体的なアプローチが必要だと強調した。それは、一連の行動を分析し、それらが全体像において何を意味するのかを理解することである。AI業界は前進しているが、意味のある正確なインサイトを提供するために行動トラッキングを進化させるためには、まだやるべきことがあると彼は指摘した。

行動を理解する、よりスマートな視覚AIモデルの作成

その後、デビッドは聴衆を舞台裏に案内し、彼のチームがYOLOv8 、そのポーズ推定能力の助けを借りて、牛の健康を監視するコンピュータ・ビジョン・ソリューションをどのように構築したかを紹介した。

彼らはまず、牛のポーズ推定用のカスタムデータセットを作成し、標準的なキーポイントの数を17から145に増やし、動きの分析に優れたモデルにすることから始めた。その後、200万枚以上の画像と1億1,000万件の行動例からなる膨大なデータセットでモデルを学習させた。 

先進的なハードウェア・インフラを使用することで、デイビッドのチームは、従来のハードウェアでは数週間かかっていたモデルの訓練をわずか2日で行うことができた。訓練されたモデルは、複数のビデオフレームを同時に分析し、牛の行動パターンを検出するカスタムビヘイビアトラッカーと統合された。

その結果、食べる、飲む、横になるなど、8つの異なる牛の行動を検出・追跡し、健康上の懸念を示す可能性のある些細な行動の変化を見つけることができる、ビジョンAI主導のソリューションが誕生した。これにより、酪農家は迅速に行動できるようになり、牛群管理が改善される。

行動AIの前途

デイビッドは、聴衆と重要な教訓を分かち合うことで講演を締めくくった:「もしAIに失敗する余地を与えないのであれば、失敗するように仕向けることになる。彼は、AIはその長所にもかかわらず、完璧ではないと指摘した。AIはパターンから学習するツールであり、常に物事を正しく理解できないことがある。重要なのは、そのようなミスを恐れるのではなく、ミスに対応できるシステムを構築し、時間をかけて改善し続けることなのだ。

これは、コンピュータ・ビジョンのモデルそのものに関しても言えることだ。例えば、Ultralytics YOLO モデルの最新版であるUltralytics YOLO11 は、YOLOv8 と比較して、次のレベルへ進む必要性を念頭に置いて構築されている。 

図5. YOLO11 がサポートするコンピュータ・ビジョン・タスク。

特に、YOLO11 、農業やヘルスケアのような精度が鍵となるリアルタイムアプリケーションに関して、より優れたパフォーマンスを提供する。その高度な機能により、YOLO11 、革新的なリアルタイムの洞察を提供し、より効果的に課題に取り組む手助けをすることで、産業界がAIをどのように利用するかを再定義している。

要点

YV24でのデイビッドの基調講演は、AIが単なるクールなイノベーションではなく、現実の問題を解決し、私たちの生活や働き方を改善するための強力なツールであることを再認識させるものだった。行動に注目することで、AIは動物の健康状態を追跡したり、日常的な行動から意味のあるパターンを認識したりといった分野ですでにインパクトを与えている。 

行動AIの可能性はエキサイティングであり、まだ始まったばかりである。生のデータを実用的な洞察に変換することで、行動AIは受動的な監視から能動的な問題解決へとシフトする。さらに発展すれば、行動AIはよりスマートな意思決定を促し、プロセスを合理化し、私たちの生活に有意義な改善をもたらすだろう。

AIとその実世界での応用についてもっと学ぶために、私たちのコミュニティとつながっていましょう。GitHubリポジトリで農業におけるAIや 製造業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。

Facebookのロゴツイッターのロゴリンクトインのロゴコピー・リンク・シンボル

このカテゴリの続きを読む

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう