Ultralytics YOLO で画像セグメンテーションのパワーを発見してください。ピクセルレベルの精度、種類、アプリケーション、実際のAI使用例をご覧ください。
画像セグメンテーションは、コンピュータビジョン(CV)における基本的な技術であり、デジタル画像を複数の異なる領域またはセグメントに分割することを含む。主な目的は、画像内のすべてのピクセルにクラスラベルを割り当てることであり、基本的に画像表現をより意味のある、機械が分析しやすいものに単純化することである。長方形のバウンディングボックスを使用してオブジェクトを識別するオブジェクト検出とは異なり、画像セグメンテーションは、オブジェクトの正確な形状を概説し、画像コンテンツのはるかに詳細な、ピクセルレベルの理解を提供します。この精度は、詳細な空間認識を必要とするタスクにとって極めて重要である。
画像セグメンテーションアルゴリズムは、画像をピクセルごとに調べ、特定の特徴(色、強度、テクスチャ、空間的な位置など)を共有するピクセルをセグメントにグループ化することで機能する。初期の手法は、閾値処理、領域拡大、クラスタリング(K-Means、DBSCAN)などのテクニックに依存していた。しかし、現代のアプローチは、深層学習(DL)、特に畳み込みニューラルネットワーク(CNN)を多用している。これらのニューラルネットワークは、学習データから複雑な階層的特徴を直接学習し、ピクセル単位の分類を行う。典型的な出力はセグメンテーションマスクで、各ピクセルの値が属するクラスラベルに対応する画像であり、オブジェクトや領域の正確な境界を視覚的に強調する。次のようなフレームワークがあります。 PyTorchや TensorFlowなどのフレームワークが、これらのモデルの構築と学習によく使用される。
画像セグメンテーションのタスクは、オブジェクトやクラスの扱い方によって異なる:
画像セグメンテーションによって提供される詳細な分析は、多くのアプリケーションを可能にする:
Ultralytics YOLOモデル YOLOv8や YOLO11などのYOLOモデルは、インスタンスのセグメンテーションタスクに最先端の性能を提供し、リアルタイムの推論のための速度と精度のバランスをとる。Ultralytics フレームワークは、COCOのようなデータセットや、車の部品や 亀裂のセグメンテーションのような特殊なデータセットで、カスタムセグメンテーションモデルをトレーニングするプロセスを簡素化します。Ultralytics HUBのようなツールは、データセットの管理、モデルのトレーニング(クラウドトレーニングが可能)、およびモデルのデプロイのための合理化されたプラットフォームを提供します。実装の詳細については、セグメンテーションタスクのドキュメントを調べたり、事前にトレーニングされたYOLOv8 モデルによるセグメンテーションや Google ColabのYOLO11 画像セグメンテーションのようなガイドに従うことができます。