画像分類のためのUltralytics YOLO11の使い方

アビラミ・ヴィナ

4 min read

2024年11月11日

新しいUltralytics YOLO11モデルがどのように画像分類を向上させ、農業、小売業、野生動物モニタリングのタスクでより高い精度を提供するかをご覧ください。

例えば、ロボットが2匹の猫を見ているとしよう。そのためには、画像分類を使用することができる。画像分類は、画像内の物体やシーンを識別し、分類するのに役立つコンピューター・ビジョン・タスクである。実際、近年の人工知能(AI)の進歩のおかげで、画像分類は 動物のモニタリングから製造業、農作物の病気検出といった農業に至るまで、幅広い用途で使用できるようになった。

画像分類における最新の進歩のひとつが、UltralyticsのYOLO11モデルです。Ultralyticsの年次ハイブリッドイベントYOLO Vision 2024(YV24)で発表されたYOLO11は画像分類を含む様々なVision AIタスクに簡単かつ正確に取り組むように設計されています。

この記事では、画像分類の基礎を探求し、実際のアプリケーションについて説明し、Ultralytics Pythonパッケージを通して YOLO11を 画像分類に使用する方法を紹介します。また、簡単なステップでUltralytics HUBで YOLO11の機能を試す方法も紹介します。さっそく始めましょう!

__wf_reserved_inherit
図1.Ultralytics YOLO11を使ってペルシャ猫を分類した例。

画像分類とは?

画像分類は、以前にラベル付けされた画像から学習したパターンに基づいて、画像にラベルやタグを割り当てることで機能する。画像のピクセルを注意深く分析することで、コンピュータ・ビジョン・モデルは画像に最適なものを見つけることができる。YOLO11のような信頼性の高いモデルは、このプロセスをシームレスに処理することができます。YOLO11のモデル・アーキテクチャは、画像やビデオ・フレームをほぼ瞬時に処理することを可能にし、高速で正確な画像分類を必要とするアプリケーションに理想的です。

画像分類の範囲を真に理解するには、オブジェクト検出のような他のタスクと区別することが役立ちます。画像分類が画像全体にラベルを付けるのに対し、物体検出は画像内の各物体を識別し、位置を特定します。 

__wf_reserved_inherit
図2.画像分類、物体検出、画像分割の比較。

キリンの画像を考えてみよう。画像分類では、モデルはその全体的な内容に基づいて、画像全体を単にキリンとラベル付けするかもしれない。しかし、物体検出では、モデルはキリンを識別するだけでなく、キリンの周囲にバウンディングボックスを配置し、画像内の正確な位置を特定します。

さて、キリンが他の動物たちと一緒にサバンナの木の近くに立っているとしよう。画像分類モデルでは、シーン全体をサバンナとラベル付けするか、あるいは野生動物だけとラベル付けするかもしれない。しかし、物体検出を使えば、モデルは各要素を個別に識別し、キリン、木、他の動物、それぞれのバウンディングボックスを認識する。

YOLO11画像分類アプリケーション

画像分類のためのUltralytics YOLO11モデルの精度と性能は、幅広い産業で有用です。画像分類におけるYOLO11の主な応用例をいくつか見てみましょう。

農業におけるYOLO11画像の分類

画像分類は、農業や農作業における多くの機能の効率化に役立つ。具体的には、YOLO11のような画像分類モデルを使用することで、農家は作物の健康状態を常に監視し、深刻な病気を検出し、害虫の発生を高い精度で特定することができる。 

これがどのように機能するのかを紹介しよう:

  • 画像キャプチャカメラやドローンなどの モノのインターネット(IoT)デバイスを 導入することで、圃場全体の様々な角度や場所から作物の画像をリアルタイムで撮影することができる。
  • 処理:
    ‍ 利用可能なリソースと接続性に応じて、画像はエッジコンピューティングを通じてオンサイトで処理することも、より集中的な分析のためにクラウドにアップロードすることもできる。
  • YOLO11による画像分類: YOLO11モデルはこれらの画像を分析し、様々な作物の状態を分類することができます。一般的な分類には、健全、病害、害虫、栄養不足などがあり、圃場の異なるエリアに影響を及ぼす特定の問題を特定するのに役立ちます。
  • 洞察の生成:YOLO11は、分類に基づき、作物の健康指標に関する洞察を提供し、農家が病気の初期兆候を検出したり、病害虫のホットスポットを特定したり、栄養不足を発見したりするのに役立つ
    ‍。
  • 情報に基づく意思決定:このような洞察により、農家は灌漑、施肥、害虫駆除について的を絞った決定を下すことができ、最も必要な場所にのみ資源を投入することができる。
__wf_reserved_inherit
図3.健康な葉から感染した葉まで、さまざまなクラスの葉の例。

小売業におけるYOLO11の画像分類

画像分類は、小売店のショッピング体験を大幅に改善し、よりパーソナライズされたユーザーフレンドリーなものにします。小売業者はカスタムトレーニングされたコンピュータビジョンモデルを使用して在庫の商品を認識し、この機能をモバイルアプリやウェブサイトに統合することができます。顧客は写真をアップロードするだけで商品を検索できるため、買い物がより迅速かつ便利になる。

顧客がビジュアル検索システムに画像をアップロードすると、検索結果が表示されるまでにいくつかのことが舞台裏で起こります。 

まず、物体検出を使用して、衣服や家具の一部を識別し、背景から分離するなど、画像内の主要なアイテムを選び出すことができる。次に、画像分類を使用して、各アイテムをさらに分類し、それがジャケットなのか、シャツなのか、ソファなのか、テーブルなのかを認識することができる。 

この情報により、システムは購入可能な類似商品を引き出すことができ、言葉だけでは説明しにくいユニークな商品や流行の商品を見つけるのに特に役立つ。同じテクノロジーは、商品を自動的に認識し分類することで、在庫管理など他の小売業務の効率化にも役立つ。

__wf_reserved_inherit
図4.画像分類に基づく視覚的検索プラットフォームの動作。

YOLO11画像分類による野生動物モニタリング

従来、野生の動物を監視するのは、何千枚もの写真を多くの人が手作業で分類・分析する面倒な作業だった。YOLO11のようなコンピューター・ビジョン・モードを使えば、研究者は自動的に動物をより速いスピードで監視することができる。カメラを自然の生息地に設置して写真を撮ることができる。そして、ビジョンAIモデルを使ってこれらの写真を分析し、(もしいれば)その中の動物を分類することができる。このようなシステムは、研究者が動物の個体数や移動パターンなどを調査・追跡するのに役立つ。

YOLO11のようなAIやコンピュータービジョンモデルがこの分野で役立つもうひとつの方法は、絶滅危惧種を分類するプロセスを合理化することだ。動物が属する可能性のある種や品種のカテゴリーを特定することで、これらのモデルは研究者にとって不可欠なデータを提供することができる。たとえば、タスマニア大学(UTAS)は、タスマニアのさまざまな野生動物を監視するために、画像分類ベースのシステムを開発した。モデルからの予測は、科学者や研究者が動物の活動や行動を監視するのに役立ち、密猟や生息地の喪失などの脅威を知らせる可能性がある。 

__wf_reserved_inherit
図5.YOLO11は犬が属する可能性のある犬種を予測する。

YOLO11モデルで画像分類を試す

さて、画像分類とは何かについて説明し、その応用例をいくつか探りました。新しいYOLO11モデルを使って画像分類を試す方法を見てみましょう。Ultralytics Pythonパッケージを使う方法と、Ultralytics HUBを使う方法です。両方の方法について説明します。

YOLO11を使った推論の実行

Ultralytics Pythonパッケージを使い始めるには、pip、conda、またはDockerを使用してインストールするだけです。何か問題が発生した場合は、トラブルシューティングに役立つヒントが満載のよくある問題ガイド」をご覧ください。

パッケージがインストールされると、以下のコードを使ってYOLO11画像分類モデルの変種をロードし、画像に対して推論を実行することができる。推論を実行するということは、新しい未知のデータに対して予測を行うために学習済みモデルを使うということです。お好きな画像で試してみてください!

__wf_reserved_inherit
図6.YOLO11モデルを使った推論の実行。

カスタムYOLO11分類モデルのトレーニング

同じPythonパッケージを使って、カスタムYOLO11分類モデルをトレーニングすることもできます。カスタム学習により、特定のニーズに合わせてYOLO11モデルを微調整することができる。例えば、異なる猫種を分類するアプリを開発する場合、その目的のためだけにYOLO11モデルをカスタムトレーニングすることができます。

以下のコードは、YOLO11画像分類モデルをロードしてトレーニングする方法を示しています。このコードでは、学習済みの重みを転送し、既存のモデルの知識を使って、自分のモデルの性能を向上させることができます。fashion-mnist "データセットのように、データセットを指定することができます。このデータセットは、衣類(シャツ、ズボン、靴など)のグレースケール画像からなる、よく知られたセットです。このデータセットでモデルをトレーニングすることで、さまざまな衣類のカテゴリーを認識できるようになる。fashion-mnist」を、猫の品種や植物の種類など、あなたのプロジェクトに合った任意のデータセットに置き換えることができます。

__wf_reserved_inherit
図7.画像分類のためのYOLO11モデルのカスタムトレーニング。

Ultralytics HUBでYOLO11を試す

Ultralyticsパッケージの使用は簡単ですが、Pythonの知識が必要です。もっと初心者に優しいオプションをお探しなら、Ultralytics HUBを利用することができます。このプラットフォームは、様々なYOLOモデルのトレーニングやデプロイを簡単かつアクセスしやすくするように設計されています。開始するには、アカウントを作成する必要があります。

サインインしたら、「モデル」セクションに移動し、画像分類のためにYOLO11モデルを選択します。nano、small、medium、large、extra-largeのサイズからお選びいただけます。モデルを選択した後、「プレビュー」セクションで画像をアップロードすることができ、画像が処理されるとページの左側に予測が表示されます。

__wf_reserved_inherit
図8.Ultralytics HUBを使って推論を実行する。

要点

YOLO11は、様々な産業分野に新たな可能性を開く強力な画像分類機能を提供します。農業における作物モニタリングの改善、小売業における商品検索の強化から野生動物保護のサポートまで、YOLO11のスピードと精度は多様なアプリケーションに理想的です。Ultralytics Pythonパッケージによるカスタムトレーニングや、Ultralytics HUBでのユーザーフレンドリーなノーコードセットアップのオプションにより、ユーザーはYOLO11をワークフローに簡単に組み込むことができます。より多くの業界がAIソリューションを採用する中、YOLO11はイノベーションと実用的な進歩をサポートする柔軟で高性能なツールを提供します。

GitHubリポジトリにアクセスし、私たちのコミュニティに参加してください。自動運転車や ヘルスケアにおけるAIアプリケーションについては、ソリューションページをご覧ください。🚀

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう

無料で始める
クリップボードにコピーされたリンク