用語集

パノプティック・セグメンテーション

パノプティック・セグメンテーションが、AIアプリケーションにおける正確なピクセルレベルのシーン理解のために、セマンティック・セグメンテーションとインスタンス・セグメンテーションをどのように統合しているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

パノプティックセグメンテーションは、ピクセルレベルでの包括的なシーン理解を提供することを目的とした、高度なコンピュータビジョン技術である。パノプティックセグメンテーションは、各ピクセルを意味的なカテゴリ(人、車、道路など)に分類するセマンティックセグメンテーションと、個々のオブジェクトのインスタンス(車や人など)を個別に検出してセグメンテーションするインスタンスセグメンテーションの両方を統合し、拡張したものである。要するに、パノプティックセグメンテーションは、画像内のすべてのピクセルに意味的なラベルを割り当てると同時に、オブジェクトの個別のインスタンスを区別し、より豊かで完全なシーン解釈を提供する。

パノプティック・セグメンテーションを理解する

パノプティック・セグメンテーションは、バウンディング・ボックス内のオブジェクトの識別とローカライズに重点を置くオブジェクト検出とは異なり、画像のより詳細な理解を提供する。セマンティックセグメンテーションは、すべてのピクセルを事前に定義されたカテゴリに分類するが、 同じオブジェクトクラスの個々のインスタンスを区別することはない。たとえば、セマンティックセグメンテーションでは、1 台の車を別の車と区別することなく、すべての車を「車」とラベル付けする。インスタンスセグメンテーションは、各オブジェクトのインスタンスを検出し、それぞれにセグメンテーションマスクを作成することで、この問題に対処しますが、通常、「モノ」クラス(数えられるオブジェクト)に焦点を当て、「モノ」クラス(空、道路、草のような非定形領域)を無視することがあります。

パノプティック・セグメンテーションは、両方のタスクを同時に包括的に実行することで、このギャップを埋める。パノプティックセグメンテーションは、すべてのピクセルに意味的なラベルを割り当て、それを「モノ」クラス(例:人、車、自転車)と「モノ」クラス(例:空、道路、草)のいずれかに分類する。モノ」クラスについては、インスタンスIDも提供し、各オブジェクトインスタンスを効果的にセグメント化して区別する。この統一されたアプローチにより、画像内のすべてのピクセルが説明され、有意義に分類され、全体的なシーン理解につながります。探索できる Ultralytics YOLOモデルは、セグメンテーションを含む様々なコンピュータビジョンタスクの最前線にあり、これらの複雑なタスクに効率的で正確なソリューションを提供します。

パノプティック・セグメンテーションの仕組み

汎化セグメンテーションモデルは、通常、セマンティックセグメンテーションとインスタンスセグメンテーションの両方を同時に実行するように設計された、ディープラーニングアーキテクチャを活用する。これらのモデルは、多くの場合、入力画像から特徴を抽出するために共有バックボーンネットワークを使用し、その後、セマンティックとインスタンスのセグメンテーションタスクを処理するために、別々のブランチまたはヘッドを使用する。例えば、一般的なアプローチでは、ネットワークを使用して各画素の意味ラベルを予測し、同時に「もの」領域のインスタンスマスクとクラス確率を予測する。これらの出力が組み合わされ、最終的なパノプティックセグメンテーション結果が生成される。

のような高度なモデルには、セグメンテーション機能が組み込まれている。 Ultralytics YOLOv8のような先進的なモデルには、セグメンテーション機能が組み込まれており、全視野セグメンテーションモデルのトレーニングと推論が可能になっている。Ultralytics HUBのようなプラットフォームは、これらのモデルのトレーニング、管理、展開のプロセスをさらに合理化することができる。

パノプティック・セグメンテーションの用途

パノプティックセグメンテーションは、シーンを詳細に理解することができるため、さまざまな用途で重宝される:

  • 自律走行:自動運転車が安全に航行するためには、周囲の環境を総合的に理解する必要がある。パノプティックセグメンテーションは、自律走行車が歩行者、車両、交通標識、路面などの様々な道路要素を同時に識別し、区別するのに役立ちます。この詳細なシーンの解釈は、自律走行ナビゲーションにおける意思決定に極めて重要である。自動運転車におけるAIの研究は、パノプティックセグメンテーションのようなコンピュータビジョンタスクの重要な役割を強調している。

  • ロボット工学ロボット工学では、特に複雑な環境でのナビゲーションや操作のような作業において、汎光セグメンテーションはロボットに周囲の環境を豊富に理解させる。ロボットはパノプティック・セグメンテーションを使用して、対話が必要な対象物、回避すべき障害物、航行可能なエリアを区別することができる。例えば、倉庫内では、ロボットはパノプティックセグメンテーションを使用して、棚にあるさまざまな種類の商品を識別し、箱や人の周りをナビゲートすることができる。 NVIDIA JetsonデバイスにUltralytics YOLO モデルを統合することで、エッジ・ロボティクス・アプリケーションにリアルタイムの汎光セグメンテーション機能をもたらすことができる。

  • 都市計画とスマートシティパノプティック・セグメンテーションを使用して、空撮画像や街頭画像から都市の情景を分析することで、都市計画に貴重なデータを提供することができる。建物のフットプリント、道路網、緑地のマッピング、ストリートファニチャーやインフラの特定といった作業に役立つ。この情報は、都市開発、交通管理、スマートシティにおける資源配分に利用できる。

  • 医療画像解析:医療分野では、汎光セグメンテーションを医用画像に適用することで、異なる組織タイプ、臓器、病理学的領域を同時にセグメンテーションし、細胞や病変の個々のインスタンスを区別することができる。この詳細な分析は、診断、治療計画、医学研究に役立つ。医療画像解析は、AIを活用したセグメンテーション技術がますます重要になる成長分野である。

画像の統一的で詳細な理解を提供することで、パノプティックセグメンテーションは、さまざまなAIや機械学習アプリケーションにおいて影響力を増している強力なツールである。

すべて読む