用語集

パノプティック・セグメンテーション

パノプティック・セグメンテーションが、AIアプリケーションにおける正確なピクセルレベルのシーン理解のために、セマンティック・セグメンテーションとインスタンス・セグメンテーションをどのように統合しているかをご覧ください。

パノプティックセグメンテーションは、シーン全体をピクセルレベルで包括的に理解する、高度なコンピュータビジョン(CV)タスクである。このタスクは、セマンティックセグメンテーションと インスタンスセグメンテーションという2つの別々のタスクを統合したものである。その目的は、画像内のすべてのピクセルにクラスラベル(車、人、空など)と、明確なオブジェクトについては一意のインスタンス ID の両方を割り当てることである。これにより、どちらのセグメンテーション手法も単独で達成できるよりも全体的で詳細な出力が得られ、人間の視覚に近い詳細さで機械が視覚環境を認識できるようになる。この用語は、FAIRの研究者による2018年の画期的な論文「Panoptic Segmentation」で紹介された。

パノプティックとその他のセグメンテーションタイプ

パノプティック・セグメンテーションを完全に理解するには、その構成部分と比較することが役に立つ:

  • セマンティック・セグメンテーションこの手法は、画像内のすべてのピクセルを特定のカテゴリーに分類する。例えば、車に属するすべてのピクセルを "車"、道路のすべてのピクセルを "道路 "と分類する。しかし、同じオブジェクトクラスの異なるインスタンスを区別することはできない。隣り合う2台の別々の車は、どちらも同じ "車 "ピクセルマップの一部となる。
  • インスタンスのセグメンテーション この方法は、しばしば "モノ"(車、歩行者、動物など)と呼ばれる個々の物体を検出し、セグメント化する。検出された各オブジェクトのインスタンスには、一意のマスクが割り当てられる。 car_1, car_2そして pedestrian_1.しかし、インスタンス・セグメンテーションは、通常、明確な形状や数を持たない非定形の背景領域、つまり「もの」(空、道路、草、壁など)を無視する。
  • パノプティック・セグメンテーション: これは、セマンティック・セグメンテーションとインスタンス・セグメンテーションの両方の長所を兼ね備えている。画像内のすべてのピクセルをセグメンテーションし、"モノ "と "コト "のクラスラベルを提供する。重要なのは、それぞれの "もの "に一意のインスタンスIDを割り当てることで、完全で統一されたシーン解釈を提供することである。例えば、パノプティック・モデルは、空と道路にラベルを付けるだけでなく、次のようなものも識別して区別する。 car_1, car_2そして pedestrian_1 別個の存在として。このような包括的なアプローチは、先進国にとって不可欠である。 AIアプリケーション.

パノプティック・セグメンテーションの用途

パノプティックセグメンテーションが提供する詳細なシーン理解は、さまざまな領域で非常に貴重である:

  • 自律走行車自動運転車は、安全なナビゲーションのために周囲の状況を完全に把握する必要がある。パノプティック・セグメンテーションは、道路や歩道のような無定形の表面(「もの」)を識別する一方で、個々の車、歩行者、自転車(「もの」)を、それらが重なっていても区別することを可能にする。Waymoのような企業のシステムで実証されているように、この詳細な認識は、安全な進路計画と意思決定に不可欠です。Ultralyticsが車載ソリューションのAIにどのように貢献しているかをご覧ください。
  • 医療画像解析 MRIや CTスキャンなどの医療スキャンを解析する際、汎光セグメンテーションは様々な組織タイプ(「もの」)を区別することができ、同時に腫瘍や個々の細胞(「もの」)のような構造の特定のインスタンスを識別することもできる。これにより、より正確な診断をサポートし、手術計画を支援し、病気の進行をモニターすることができる。腫瘍検出にYOLO11を使用するなどの関連タスクについては、こちらをご覧ください。
  • ロボット工学ロボットが環境と効果的に相互作用するためには、一般的なレイアウト(壁、床)と、ロボットが操作できる特定のオブジェクト(ツール、部品)の両方を理解する必要があります。パノプティック・セグメンテーションは、倉庫や工場のような複雑な環境において、ナビゲーションと人間とロボットのインタラクションを向上させ、この統合されたビューを提供します。ロボット工学におけるAIの役割についてもっと知る。
  • 拡張現実(AR):ARアプリケーションは、汎光セグメンテーションを使用して、仮想オブジェクトと現実世界をシームレスに融合させる。背景の表面と前景のオブジェクトの位置を理解することで、ARシステムは仮想コンテンツをリアルに配置し、オクルージョンを正しく処理することができる。これがAR技術の大きな進歩につながっている。
  • 衛星画像解析この技術は詳細な土地被覆マッピングに使用され、森林や水域のような大規模なエリアタイプ(「モノ」)と、建物や車両のような個々の構造物(「コト」)を区別する。USGSのような政府機関は、このデータを環境モニタリングや都市計画に利用している。

モデルと実施

パノプティックセグメンテーションモデルは通常、PyTorchのようなディープラーニングフレームワークを使用して構築され、COCO-Panopticや Cityscapesのような大規模なデータセットで学習される。YOLO11のようなUltralyticsモデルは、オブジェクト検出や インスタンスセグメンテーションのようなコアタスクにおいて最先端の性能を提供し、これらは不可欠なビルディングブロックであるが、パノプティックセグメンテーションは、統合されたシーン理解の次のレベルに相当する。Google AIや Meta AIのような機関での研究が進むにつれて、これらの包括的なモデルの能力は常に向上し、より洗練された認識力の高いAIシステムへの道を開いている。Ultralytics HUBのようなプラットフォームを使って、関連タスクのモデルを管理・訓練することができます。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク