用語集

インスタンスのセグメンテーション

インスタンス・セグメンテーションがピクセル・レベルの精度でオブジェクト検出を精緻化し、AIアプリケーション用の詳細なオブジェクト・マスクを実現する方法をご覧ください。

インスタンスセグメンテーションは、画像内のオブジェクトを識別し、個々のインスタンスの正確な境界をピクセルレベルで定義する、高度なコンピュータビジョン（CV）技術である。オブジェクトの周囲にボックスを配置するだけの手法とは異なり、インスタンス・セグメンテーションでは、検出されたすべてのオブジェクトに対して一意のマスクを作成することで、たとえそれらが同じクラスに属していたとしても、シーンをより詳細に理解することができる。この機能は、個別のオブジェクトの正確な形状、サイズ、および空間的な範囲を知ることが不可欠である高度な人工知能（AI）アプリケーション、特にオブジェクトが重なり合っている場合に極めて重要である。

インスタンス・セグメンテーションの仕組み

インスタンスのセグメンテーションモデルは、画像を解析して、まず潜在的なオブジェクトを見つけ、次に、検出された各オブジェクトについて、どのピクセルがその特定のインスタンスに属するかを予測する。従来のアプローチは、有力なマスク R-CNNアーキテクチャのように、多くの場合、2 段階のプロセスを採用している。第 1 に、オブジェクト検出を実行してバウンディングボックスの提案を生成し、第 2 に、提案された各ボックス内でセグメンテーションマスクを生成する。効果的ではあるが、これらの手法は計算負荷が大きい。

最近のアプローチには、次のようなモデルがある。 Ultralytics YOLOのようなモデルを含む最近のアプローチでは、シングルステージパイプラインを使用することが多い。これらのモデルは、ニューラルネットワーク（NN）を一回通すだけで、バウンディングボックス、クラスラベル、インスタンスマスクを同時に予測するため、速度が大幅に向上し、リアルタイム推論に適している。これらのモデルの学習には、広く使用されているCOCOデータセットのような、ピクセルレベルの注釈を持つ大規模なデータセット、特にそのセグメンテーション注釈が必要である。このプロセスには通常、複雑な視覚的特徴を学習するために畳み込みニューラルネットワーク（CNN）を活用したディープラーニング（DL）技術が含まれる。

インスタンスのセグメンテーション対関連タスク

インスタンスセグメンテーションを他の画像セグメンテーション作業と区別することは重要である：

オブジェクト検出：バウンディングボックスを使用してオブジェクトの存在と位置を特定するが、形状情報は提供しない。インスタンス・セグメンテーションは、各オブジェクトの正確なピクセルをアウトライン化することで、さらに進化する。
意味的セグメンテーション：画像の各ピクセルにクラスラベルを割り当てる（例："車"、"人"、"道路"）。ただし、同じクラスの異なるインスタンスを区別しない。たとえば、すべての車は同じ "car" セグメントに含まれます。インスタンスセグメンテーションとセマンティックセグメンテーションの違いについては、こちらのガイドを参照してください。
パノプティックセグメンテーション：セマンティックセグメンテーションとインスタンスセグメンテーションを組み合わせたもの。セマンティックセグメンテーションのように）すべてのピクセルにクラスラベルを割り当て、（インスタンスセグメンテーションのように）各オブジェクトのインスタンスを一意に識別する。

インスタンス・セグメンテーションは、特に個々のオブジェクト・インスタンスを検出して区別することに重点を置き、オブジェクトの境界と分離に関して高い精度を提供する。

インスタンス分割の応用

個々の物体を正確に識別し、分離する能力により、インスタンスのセグメンテーションは多くの分野で貴重なものとなっている：

自律走行：自動運転車は、周囲の状況を正確に認識するために、インスタンスのセグメンテーションに依存している。個々の車両、歩行者、自転車、障害物を、乱雑なシーンや重なり合ったシーンであっても区別することは、安全なナビゲーションと意思決定に不可欠である。Waymoのような企業は、このような技術を幅広く使用している。
医療画像解析：放射線学や病理学では、インスタンス・セグメンテーションにより、スキャン画像（CT、MRIなど）の腫瘍、臓器、細胞などの特定の構造の輪郭を描くことができます。このピクセルレベルの精度は、診断、腫瘍の大きさの測定、手術の計画、病気の進行の追跡に役立ちます。例えば、腫瘍の検出にYOLO11 使用することで、ヘルスケアにおけるAIの幅広い文脈の中でこのアプリケーションを紹介することができる。
ロボット工学：非構造化環境で把持や操作などのタスクを実行するロボットは、個々の物体を正確に識別し、位置を特定する必要がある。インスタンスのセグメンテーションにより、ロボットはアイテムの正確な形状と境界を理解し、インタラクションを成功させることができる。
衛星画像解析：詳細な土地被覆マッピング、個々の建物を特定することによる都市のスプロール化の監視、船舶や車両などの特定の物体の追跡に使用される。このレベルの詳細は、環境モニタリング、資源管理、情報収集をサポートします。一般的な衛星画像解析技術をご覧ください。
農業モニタリング：個々の植物や果実の計数、植物ごとの作物の健康状態の評価、特定の種類の雑草の特定など、精密農業に貢献する。

Ultralytics YOLOインスタンスのセグメンテーション

Ultralytics 、効率的なインスタンスのセグメンテーションを実行できる最先端のモデルを提供します。以下のようなモデル YOLOv8や YOLO11などのモデルは、インスタンスのセグメンテーション（セグメンテーションタスクの詳細を参照）など、さまざまなコンピュータビジョンタスクで高い性能を発揮するように設計されています。ユーザーは、Ultralytics HUBプラットフォームのようなツールを使用して、事前に訓練されたモデルを活用したり、カスタムデータセットで微調整を行ったりすることができます。実践的な実装のために、事前にトレーニングされたUltralytics YOLOv8 モデルによるセグメンテーションのチュートリアルや、セグメンテーションオブジェクトの分離に関するガイドなどのリソースが用意されています。また、 Ultralytics YOLO11 インスタンスセグメンテーションに使用する方法を学ぶこともできます。人気のあるフレームワーク PyTorchや TensorFlowなどの一般的なフレームワークは、これらのモデルの開発とデプロイによく使用されます。

ブログをもっと読む

A deep dive into detecting pills using Ultralytics YOLO11

Build AI-powered drone applications with Ultralytics YOLO11

害虫駆除のためのUltralytics YOLO11 & 物体検知の活用

2025年1月2日

すべて読む