パノプティック・セグメンテーションが、AIアプリケーションにおける正確なピクセルレベルのシーン理解のために、セマンティック・セグメンテーションとインスタンス・セグメンテーションをどのように統合しているかをご覧ください。
パノプティックセグメンテーションは、シーン全体をピクセルレベルで包括的に理解する、高度なコンピュータビジョン(CV)タスクである。このタスクは、セマンティックセグメンテーションと インスタンスセグメンテーションという2つの別々のタスクを統合したものである。その目的は、画像内のすべてのピクセルにクラスラベル(車、人、空など)と、明確なオブジェクトについては一意のインスタンス ID の両方を割り当てることである。これにより、どちらのセグメンテーション手法も単独で達成できるよりも全体的で詳細な出力が得られ、人間の視覚に近い詳細さで機械が視覚環境を認識できるようになる。この用語は、FAIRの研究者による2018年の画期的な論文「Panoptic Segmentation」で紹介された。
パノプティック・セグメンテーションを完全に理解するには、その構成部分と比較することが役に立つ:
car_1
, car_2
そして pedestrian_1
.しかし、インスタンス・セグメンテーションは、通常、明確な形状や数を持たない非定形の背景領域、つまり「もの」(空、道路、草、壁など)を無視する。car_1
, car_2
そして pedestrian_1
別個の存在として。このような包括的なアプローチは、先進国にとって不可欠である。 AIアプリケーション.パノプティックセグメンテーションが提供する詳細なシーン理解は、さまざまな領域で非常に貴重である:
パノプティックセグメンテーションモデルは通常、PyTorchのようなディープラーニングフレームワークを使用して構築され、COCO-Panopticや Cityscapesのような大規模なデータセットで学習される。YOLO11のようなUltralyticsモデルは、オブジェクト検出や インスタンスセグメンテーションのようなコアタスクにおいて最先端の性能を提供し、これらは不可欠なビルディングブロックであるが、パノプティックセグメンテーションは、統合されたシーン理解の次のレベルに相当する。Google AIや Meta AIのような機関での研究が進むにつれて、これらの包括的なモデルの能力は常に向上し、より洗練された認識力の高いAIシステムへの道を開いている。Ultralytics HUBのようなプラットフォームを使って、関連タスクのモデルを管理・訓練することができます。