用語集

画像分割

Ultralytics YOLO で画像セグメンテーションのパワーを発見してください。ピクセルレベルの精度、種類、アプリケーション、実際のAI使用例をご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

画像セグメンテーションは、コンピュータビジョン(CV)における基本的な技術であり、デジタル画像を複数の異なる領域またはセグメントに分割することを含む。主な目的は、画像内のすべてのピクセルにクラスラベルを割り当てることであり、基本的に画像表現をより意味のある、機械が分析しやすいものに単純化することである。長方形のバウンディングボックスを使用してオブジェクトを識別するオブジェクト検出とは異なり、画像セグメンテーションは、オブジェクトの正確な形状を概説し、画像コンテンツのはるかに詳細な、ピクセルレベルの理解を提供します。この精度は、詳細な空間認識を必要とするタスクにとって極めて重要である。

画像分割の仕組み

画像セグメンテーションアルゴリズムは、画像をピクセルごとに調べ、特定の特徴(色、強度、テクスチャ、空間的な位置など)を共有するピクセルをセグメントにグループ化することで機能する。初期の手法は、閾値処理、領域拡大、クラスタリング(K-MeansDBSCAN)などのテクニックに依存していた。しかし、現代のアプローチは、深層学習(DL)、特に畳み込みニューラルネットワーク(CNN)を多用している。これらのニューラルネットワークは学習データから複雑な階層的特徴を直接学習し、ピクセル単位の分類を行う。典型的な出力はセグメンテーションマスクで、各ピクセルの値が属するクラスラベルに対応する画像であり、オブジェクトや領域の正確な境界を視覚的に強調する。次のようなフレームワークがあります。 PyTorchTensorFlowなどのフレームワークが、これらのモデルの構築と学習によく使用される。

画像分割の種類

画像セグメンテーションのタスクは、オブジェクトやクラスの扱い方によって異なる:

  • セマンティック・セグメンテーション:各ピクセルを事前に定義されたカテゴリー(例:「車」、「道路」、「空」)に割り当てる。同じオブジェクトクラスの異なるインスタンスを区別しない。例えば、すべての車は同じラベルを共有することになる。
  • インスタンス分割:セマンティック・セグメンテーションよりも一歩進んで、画像内の個々のオブジェクト・インスタンスを識別し、区別する。たとえ同じクラスに属していたとしても、それぞれの個別の車には固有の識別子またはマスクが付与される。これは、個々のオブジェクトのカウントや追跡が必要な場合に特に有効である。
  • パノプティック・セグメンテーション:セマンティックセグメンテーションとインスタンスセグメンテーションを組み合わせたもの。セマンティックセグメンテーションのように)すべてのピクセルにクラスラベルを割り当て(インスタンスセグメンテーションのように)各オブジェクトのインスタンスを一意に識別する。シーンの包括的で統一された理解を提供する。

画像分割と関連用語の区別

  • 画像セグメンテーションとオブジェクト検出の比較:オブジェクト検出は、オブジェクトの周囲に境界ボックスを描き、その位置とクラスを示す。画像セグメンテーションは、各オブジェクトや領域の正確な形状を示すピクセルレベルのマスクを提供し、単純なボックスよりも詳細な情報を提供する。
  • 画像セグメンテーションと画像分類の比較:画像分類は、画像全体に単一のラベルを割り当てる(例:「猫を含む」)。画像セグメンテーションは、画像内の各ピクセルにラベルを割り当て、複数のオブジェクトまたは領域とその形状を識別する。
  • 画像分割と画像認識画像認識とは、AIが画像内の物体、人物、場所などを識別するタスクを指す広義の用語である。画像セグメンテーションは、ピクセルレベルの分割に焦点を当てた、特定のタイプの画像認識である。

実世界での応用

画像セグメンテーションによって提供される詳細な分析は、多くのアプリケーションを可能にする:

画像分割とUltralytics YOLO

Ultralytics YOLOモデル YOLOv8YOLO11などのYOLOモデルは、インスタンスのセグメンテーションタスクに最先端の性能を提供し、リアルタイムの推論のための速度と精度のバランスをとる。Ultralytics フレームワークは、COCOのようなデータセットや、車の部品や 亀裂のセグメンテーションのような特殊なデータセットで、カスタムセグメンテーションモデルをトレーニングするプロセスを簡素化します。Ultralytics HUBのようなツールは、データセットの管理、モデルのトレーニング(クラウドトレーニングが可能)、およびモデルのデプロイのための合理化されたプラットフォームを提供します。実装の詳細については、セグメンテーションタスクのドキュメントを調べたり、事前にトレーニングされたYOLOv8 モデルによるセグメンテーションや Google ColabのYOLO11 画像セグメンテーションのようなガイドに従うことができます。

すべて読む