セマンティックセグメンテーションは、画像中の各ピクセルをあらかじめ定義されたカテゴリやクラスに分類する重要なコンピュータビジョンタスクである。他のコンピュータビジョンタスクとは異なり、セマンティックセグメンテーションは密な予測を提供し、すべてのピクセルにラベルを割り当てることで、シーンのきめ細かな理解を可能にする。このテクニックは、単にオブジェクトを検出するだけでなく、オブジェクト自体の輪郭を描き、分類することで、画像コンテンツのより豊かな解釈を提供する。
セマンティック・セグメンテーションとは?
セマンティック・セグメンテーションは、画像内の各ピクセルが何を表しているのかを理解し、それに従ってラベルを付けることを目的としている。これは、画像全体に対して単一のラベルを予測するだけの基本的な画像分類や、オブジェクトの周囲に境界ボックスを描くオブジェクト検出を超えるものである。これとは対照的に、セマンティック・セグメンテーションは、ピクセル・レベルでオブジェクトの境界を正確に描き出す。例えば、街角の画像において、セマンティックセグメンテーションは、車、歩行者、道路を識別するだけでなく、それぞれの車、歩行者、路面の正確な形状の輪郭を描き、各ピクセルをこれらのクラスのいずれかに属するものとしてラベリングする。
このピクセルレベルの分類により、セマンティックセグメンテーションは、詳細なシーン理解を必要とするアプリケーションにとって強力なツールとなる。これは教師あり学習の一形態で、モデルはピクセルレベルの注釈を持つデータセットで学習される。出力はセグメント化された画像で、各セグメントは特定のオブジェクトクラスに対応する。高度なモデルは Ultralytics YOLOv8やSegment Anything Model (SAM) のような高度なモデルを使用すると、効率的で正確なセマンティックセグメンテーションを行うことができる。
セマンティック・セグメンテーションの応用
セマンティック・セグメンテーションは、さまざまな産業で幅広く応用されている:
- 自律走行:自動運転車において、セマンティックセグメンテーションはシーンの理解に不可欠である。道路、歩道、歩行者、交通標識、他の車両を区別し、より安全なナビゲーションと意思決定を可能にする。例えば、路面を正確にセグメンテーションすることで、車両は車線内に留まることができ、歩行者や自転車を識別することで事故を防ぐことができます。自動運転車のAIについて詳しくはこちら。
- 医療画像解析:医療分野では、セマンティック・セグメンテーションは医療画像解析に広く使用されている。セマンティック・セグメンテーションは、CTスキャン、MRI、X線などの医療スキャンにおいて、関心領域の識別や描出を支援する。例えば、腫瘍、臓器、その他の解剖学的構造のセグメンテーションに使用でき、診断、治療計画、疾患進行のモニタリングに役立ちます。Ultralytics YOLO が医用画像診断における腫瘍検出にどのように使用されているかをご覧ください。
- 衛星画像と航空画像の解析:セマンティック・セグメンテーションは、衛星画像や航空画像の解析において重要な役割を果たす。セマンティック・セグメンテーションは、土地被覆の分類、都市計画、環境モニタリングに利用できる。画像を建物、森林、水域、道路などのカテゴリーにセグメンテーションすることで、都市開発、農業モニタリング、災害対応に貴重なデータを提供します。コンピュータビジョンがどのように衛星画像を解析しているかをご覧ください。
- 農業と精密農業農業では、セマンティック・セグメンテーションは作物や植生の分析に利用できる。作物と雑草を区別し、植物の健康状態を評価し、圃場の状態を監視するのに役立つ。これにより、精密農業技術が可能になり、資源利用が最適化され、作物の収量が向上します。ビジョンAIを農業に使用する最大の利点についてご覧ください。
セマンティック・セグメンテーションとオブジェクト検出およびインスタンス・セグメンテーションの比較
セマンティック・セグメンテーション、オブジェクト検出、インスタンス・セグメンテーションは、いずれもシーン理解に焦点を当てたコンピュータ・ビジョン・タスクであるが、その出力や詳細度には違いがある。
- オブジェクト検出:画像内のオブジェクトを識別し、バウンディングボックスを使用して位置を特定します。何が どこにあるかはわかるが、正確な形状やピクセルレベルの詳細はわからない。例えば、"車 "を検出し、通りのシーンでそれぞれの車の周りにボックスを描く。
- セマンティックセグメンテーション:画像の各ピクセルをあらかじめ定義されたクラスに分類し、シーンのピクセルレベルの理解を提供する。各ピクセルが何を表しているかを示す。クラス間を区別するが、同じクラスの個々のインスタンスは区別しない。例えば、車や道路が何台あるかには関係なく、すべての車のピクセルを「車」、すべての道路のピクセルを「道路」とラベル付けします。
- インスタンスセグメンテーション:オブジェクト検出とセマンティックセグメンテーションの両方の側面を併せ持つ。画像内の各オブジェクトインスタンスを検出し、各インスタンスを個別にセグメンテーションする。オブジェクトがどこにある のかを示すだけでなく、同じオブジェクトクラスの個々のインスタンスを区別する。たとえば、同じ「車」クラスに属していても、街頭のシーンではそれぞれの車を個別にセグメンテーションする。
要約すると、セマンティックセグメンテーションは画像の詳細なピクセル単位の分類を提供し、きめ細かなシーン理解を必要とするアプリケーションにとって極めて重要である。Ultralytics HUBのようなツールは、セマンティック・セグメンテーション・モデルの学習と導入のプロセスを簡素化し、この強力なテクノロジーをより身近なものにする。