用語集

画像分類

Ultralytics YOLOで画像分類を発見:最先端のツールを使ってヘルスケア、農業、小売業などのカスタムモデルをトレーニング。

画像分類はコンピュータビジョン(CV)の基本的なタスクであり、あらかじめ定義されたカテゴリセットから画像全体に単一の特定のラベルを割り当てることを含む。主な目的は、画像の主な対象を特定し、それに応じて分類することである。例えば、分類モデルは画像を分析し、"猫"、"犬"、"車 "といったラベルを出力する。このタスクは、より複雑な多くのCVアプリケーションの基礎を形成し、機械学習(ML)のコアコンポーネントである。このプロセスは、大規模なラベル付きデータセットから識別特徴を学習するアルゴリズム、特に畳み込みニューラルネットワーク(CNN)に依存している。

画像分類の仕組み

画像分類モデルは教師あり学習を使って訓練され、すでに正しいクラスが手動でラベル付けされた膨大な数の画像が与えられる。学習中、ニューラルネットワークは各カテゴリーに関連するパターン、テクスチャー、形状、色の組み合わせを識別するように学習する。この学習はバックプロパゲーションと呼ばれるプロセスによって達成され、予測値と実際のラベルの差を最小化するためにモデルの内部パラメータ(重み)を調整する。

最近の分類モデルは、多くの層を持つディープラーニングアーキテクチャを使用していることが多い。初期のレイヤーは、エッジや角のような単純な特徴を認識するように学習し、より深いレイヤーは、目、車輪、顔のような、より複雑な構造を識別するためにこれらを組み合わせる。ネットワークの最終層は通常、ソフトマックス関数を使用して、可能性のある各クラスの確率スコアを生成する。最も高い確率を持つクラスが最終的な予測として選ばれる。このプロセスの鍵は特徴抽出であり、モデルが分類タスクに最も有益な特徴を自動的に学習する。

画像分類の応用

画像分類は、視覚認識作業を自動化し、規模を拡大するために、多くの産業で使用されている。2つの顕著な例がある:

  1. 医療画像解析医療分野では、分類モデルがX線、MRI、CTスキャンなどの医療スキャンを分析し、放射線科医が病気を発見するのに役立っている。例えば、何千枚ものマンモグラフィでモデルを学習させ、画像を「良性」または「悪性」のいずれかに分類し、乳がんの早期発見に役立てることができます。これにより、より迅速な診断が可能になり、人為的ミスが減少する。これについては、米国がん協会のがん検出におけるAIの概要を参照されたい。
  2. 農業テクノロジー:農家は、ドローンや人工衛星で撮影した画像から、作物の健康状態を監視するために画像分類を利用する。モデルによって、植物の葉の画像を "健康"、"病気"、"害虫が発生している "といったカテゴリーに分類することができる。これにより、農薬や肥料の的を絞った散布が可能になり、作物の収量が向上し、持続可能な農業が促進されます。Ultralyticsが農業AIをどのようにサポートしているか、詳しくはこちらをご覧ください。

画像分類と関連タスクの比較

他のコンピュータ・ビジョン・タスクと密接に関連しているが、画像分類には明確な目的がある。それと区別することが重要である:

  • 物体の検出このタスクは分類よりもさらに一歩進んだものである。オブジェクト検出は、画像全体に1つのラベルを割り当てるのではなく、画像内の複数のオブジェクトを識別し、それぞれの周囲にバウンディング・ボックスを描き、各ボックスにクラス・ラベルも割り当てる。例えば、画像に "街並み "というラベルを付けるだけでなく、個々の "車"、"歩行者"、"信号機 "を見つけて分類する。
  • 画像分割このタスクは、各ピクセルを分類することで、画像の最も詳細な理解を提供する。すべてのピクセルにクラスを割り当てるセマンティック・セグメンテーション(たとえば、自動車に属するピクセルはすべて1色である)や、同じオブジェクトの異なるインスタンスを区別するインスタンス・セグメンテーション(たとえば、それぞれの自動車は異なる色である)など、さまざまなタイプがある。自律走行車のようなアプリケーションでは、このレベルの詳細さが重要である。

要約すると、分類は画像に何が写っているかを示し、検出は何が どこに写っているかを示し、セグメンテーションはシーン内のすべてのものの詳細なピクセルレベルのマップを提供する。

ウルトラリティクスによる画像分類

オブジェクト検出で有名なUltralytics YOLOモデルは、画像分類タスクにも優れています。YOLO11のような最先端のモデルは、直感的なUltralytics Pythonパッケージやコード不要のUltralytics HUBプラットフォームを使って、カスタムデータセット上で簡単にトレーニングや微調整ができます。

YOLO11のドキュメントには、モデルトレーニングのヒントや画像分類のためのYOLO11の使い方の詳細なガイドなど、豊富なリソースが用意されています。開発者は、ImageNetCIFAR-100Caltech-101のようなベンチマークデータセットで事前にトレーニングされたモデルを活用したり、ゼロから新しいモデルをトレーニングすることができます。最新の進歩に興味のある方には、Papers With Codeのようなリソースが、トップパフォーマンスモデルの包括的な概要を提供しています。また、標準的なベンチマークでYOLOモデルのパフォーマンスを比較することもできます。PyTorchや TensorFlowのようなフレームワークは、これらのモデルを構築しトレーニングするための基盤を提供します。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク