用語集

画像分類

Ultralytics YOLO :最先端のツールを使用して、ヘルスケア、農業、小売業などのカスタムモデルをトレーニングします。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

画像分類はコンピュータビジョン(CV)の基本的なタスクであり、視覚的コンテンツに基づいて画像全体に単一のラベルまたはカテゴリを割り当てることを含む。これは人工知能(AI)の中核的な機能であり、人間がシーンや物体を認識するのと同様に、機械が画像を理解し分類することを可能にする。機械学習(ML)、特にディープラーニング(DL)の技術を活用することで、画像分類は質問に答えることを目的としている:「この画像の主な被写体は何か?

画像分類の仕組み

このプロセスでは通常、ラベル付けされた画像の大規模なデータセットに対して、モデル(多くの場合、畳み込みニューラルネットワーク(CNN)と呼ばれる特殊なニューラルネットワーク)を学習させる。ImageNetのような有名なデータセットには、何千ものクラスに分類された何百万もの画像が含まれている。学習中、モデルは、異なるカテゴリーを区別するパターンや特徴(テクスチャ、形状、色分布など)を識別することを学習する。次のようなフレームワークがあります。 PyTorchTensorFlowなどのフレームワークが、これらのモデルを構築して訓練するためのツールを提供します。様々なUltralytics 分類データセットを探索し、独自のプロジェクトを始めることができる。目標は、訓練されたモデルが新しい未見の画像のクラスラベルを正確に予測することです。より深い技術的な理解のためには、スタンフォード大学のCS231nコースのようなリソースがCNNに関する包括的な資料を提供しています。

他の仕事との主な違い

画像分類は、画像全体に単一のラベルを割り当てることに重点を置く。これは他の一般的なCVタスクとは異なる:

これらの違いを理解することは、与えられた問題に対して適切な技術を選択するために極めて重要である。

実世界での応用

画像分類は、その比較的単純で効果的であるため、様々な領域で広く使用されている:

Ultralytics画像分類

オブジェクト検出で有名なUltralytics YOLO モデルは、画像分類タスクにも優れています。Ultralytics YOLOv11のような最新のアーキテクチャは、Ultralytics Python パッケージやコード不要のUltralytics HUBプラットフォームを使って、分類のために簡単にトレーニングすることができます。これらのツールは、モデルトレーニングのヒントや画像分類のためのUltralytics YOLOv11の使用方法のガイドのような明確なドキュメントを含む包括的なリソースを提供しています。練習のために、PyTorch 分類チュートリアルを調べたり、Kaggle画像分類コンペティションに参加することを検討してください。Papers With Codeのようなリソースを使って、最新の研究成果を入手しましょう。

すべて読む