Ultralytics YOLO で画像セグメンテーションのパワーを発見してください。ピクセルレベルの精度、種類、アプリケーション、実際のAI使用例をご覧ください。
画像セグメンテーションは、コンピュータビジョンにおける基本的な技術であり、多くの場合、ピクセルの特徴に基づいて、デジタル画像を複数のセグメントまたは領域に分割する。その目的は、画像の表現を単純化または変更し、より意味のある分析しやすいものにすることである。画像セグメンテーションでは、物体検出のようにバウンディング・ボックスで物体を識別するのではなく、各画素に特定のクラス・ラベルを割り当てる。このピクセルレベルの理解は、正確な空間的詳細が必要なタスクにとって極めて重要である。
画像セグメンテーションアルゴリズムは、画像をピクセルごとに分析し、特定の特性(色、強度、テクスチャなど)を共有するピクセルをセグメントにグループ化する。最新のアプローチでは、ディープラーニング、特に畳み込みニューラルネットワーク(CNN)を利用することが多い。CNNは、複雑なパターンを識別することを学習し、各ピクセルに適切なラベルを割り当てる。出力は通常、セグメンテーションマスクであり、各ピクセルの値が属するクラスに対応する画像である。このマスクによって、画像内のさまざまなオブジェクトや領域の正確な形状と位置が強調される。閾値処理やクラスタリングのような伝統的な手法から、高度なディープラーニングモデルまで、さまざまな画像セグメンテーション手法が存在する。
画像のセグメンテーションは、必要とされる詳細さと区別のレベルに基づいて、大きく分類することができる:
画像セグメンテーションによって提供される詳細なピクセルレベルの解析は、様々な産業における幅広いアプリケーションを可能にする:
Ultralytics YOLOモデルは、画像セグメンテーションを含む様々なコンピュータビジョンタスクに最先端の機能を提供します。YOLOv8 ようなモデルは、インスタンスセグメンテーションを効率的かつ正確に実行するように設計されており、リアルタイムアプリケーションに適しています。具体的なセグメンテーションタスクの機能については、Ultralytics ドキュメントを参照してください。一般的なCOCOデータセットや独自のデータのようなデータセットでカスタムセグメンテーションモデルをトレーニングするには、Ultralytics HUBのようなツールを使用すると効率的で、モデルのトレーニング、デプロイメント、管理プロセスが簡素化されます。実装に関するガイダンスについては、 Python事前にトレーニングされたUltralytics YOLOv8 モデルを使用したセグメンテーションのチュートリアルなどのリソースを参照してください。