Yolo 深圳
深セン
今すぐ参加
用語集

インスタンスセグメンテーション

インスタンスセグメンテーションがピクセル単位の物体検出を可能にする仕組みを学びましょう。Ultralytics を活用した高速リアルタイムマスク生成などの手法を発見してください。

インスタンスセグメンテーションは、コンピュータビジョン(CV)における高度な技術であり、画像内の個々の対象物をピクセルレベルで識別・境界設定する。標準的な物体検出が 矩形の境界ボックスを用いて位置特定するのに対し、インスタンスセグメンテーションは検出された各エンティティに対して精密なマスクを生成することで分析を深化させる。 この機能により、人工知能(AI)モデルは同一クラス内の個々のオブジェクト(例:重なり合った2人の人物を分離)を区別できるようになり、単純な分類手法と比較して視覚シーンに対するより豊かで詳細な理解を提供します。

セグメンテーションの種類の区別

インスタンスセグメンテーションの有用性を完全に理解するには、他の関連する画像処理タスクとの違いを明確にすることが有用である。各手法は、アプリケーションの要件に応じて異なる粒度レベルを提供する。

  • セマンティックセグメンテーション この手法は画像内の各ピクセルをカテゴリ(例:「道路」、「空」、「車」)に分類します。 ただし、同一カテゴリ内の個別のオブジェクトを区別しません。3台の車が隣り合って駐車している場合、 セマンティックセグメンテーションではそれらを単一の「車」領域として認識します。
  • インスタンスセグメンテーションこの手法は 各オブジェクトを独立した実体として扱う。個々のインスタンスを検出し、それぞれのピクセルに固有のラベルを割り当てる。 駐車車両の例では、インスタンスセグメンテーションは3つの異なるマスクを生成し、「車両A」「車両B」「車両C」を個別に識別する。
  • パノプティックセグメンテーション 意味的セグメンテーションの背景ラベリングとインスタンスセグメンテーションの可算物体識別を組み合わせた ハイブリッドアプローチ。

ピクセルレベル解析の仕組み

現代のインスタンスセグメンテーションモデルは、通常、高度な深層学習(DL)アーキテクチャ、特に畳み込みニューラルネットワーク(CNN)に依存している。これらのネットワークは画像から特徴を抽出し、物体のクラスとその空間的輪郭の両方を予測する。 従来、Mask R-CNNのような二段階アーキテクチャが標準であり、まず関心領域を提案し、その後それらをマスクへと精緻化していた。

しかし、近年の進歩により、YOLO26のような単一段階検出器が実現され、検出とセグメンテーションを同時に行うことが可能となった。この「エンドツーエンド」アプローチはリアルタイム推論速度を大幅に向上させ、民生用ハードウェア上でライブ動画ストリームに高精度セグメンテーションを適用することを可能にした。

実際のアプリケーション

インスタンスセグメンテーションが提供する正確な境界線は、意思決定において物体の正確な形状と位置の理解が必要な産業にとって極めて重要である。

  • 医療におけるAI 医療診断において、腫瘍や病変の正確なサイズと形状を特定することは極めて重要です。インスタンスセグメンテーションにより、モデルはMRI画像内の異常を高精度で輪郭化でき、放射線科医の治療計画立案や疾患進行のモニタリングを支援します。
  • 自動運転車 自動運転車は複雑な環境を走行するためにセグメンテーションに依存しています。Cityscapesなどのデータセットを活用することで、車両は走行可能な路面を識別し、車線標示を認識し、混雑した横断歩道で個々の歩行者を分離することで安全を確保します。
  • 農業におけるAI精密農業ではセグメンテーション技術を用いて作物の健康状態を監視する。視覚システムを搭載したロボットは個々の果実を識別して自動収穫を行ったり、detect 雑草をdetect 除草剤をピンポイントで散布したりできるため、化学薬品の使用量を削減しつつ収量を最適化できる。

Pythonによるセグメンテーションの実装

開発者は、インスタンスのセグメンテーションを簡単に実装できます。 ultralytics ライブラリ。以下の 例は、事前学習済みモデルを読み込む方法を示しています。 YOLO26 モデル および画像のセグメンテーションマスクを生成する。

from ultralytics import YOLO

# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()

課題とモデル学習

インスタンスセグメンテーションは強力である一方、単純なバウンディングボックス検出と比較して計算負荷が高い。 ピクセル単位で正確なマスクを生成するには、 GPU 精密な データアノテーションが必要となる。これらのタスクのためのデータアノテーションでは、 各オブジェクトの周囲に厳密なポリゴンを描画する必要があり、時間がかかる場合がある。

このプロセスを効率化するため、チームはしばUltralytics ツールを活用しますUltralytics データセット管理、自動アノテーション、クラウドベースのトレーニング機能を提供します。これにより開発者は、特定の産業部品や生物学的検体といったカスタムデータでモデルを微調整し、最適化されたフォーマット(例:ONNX)を用いてエッジAIデバイスへ効率的にデプロイすることが可能になります。 ONNXTensorRTなどの最適化された形式でエッジAIデバイスに効率的にデプロイできます。

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加