用語集

One-Stage Object Detectors

高速リアルタイムAI向け単段階オブジェクト検出器を探求。Ultralytics エッジAIとデプロイメントにおいて卓越した精度と効率を実現する方法を学びましょう。

ワンステージ物体検出器は、物体検出タスクを卓越した速度と効率で実行するよう設計された強力な深層学習アーキテクチャの一種である。従来の二段階物体検出器が検出プロセスを領域提案とその後の分類という別々のステップに分割するのとは異なり、ワンステージモデルは単一のパスで画像全体を分析する。検出を直接回帰問題として捉えることで、これらのネットワークは入力ピクセルから直接バウンディングボックス座標とクラス確率を同時に予測する。この合理化されたアプローチは計算オーバーヘッドを大幅に削減し、リソース制約のあるエッジAIデバイス上でのリアルタイム推論と展開を必要とするアプリケーションにおいて、ワンステージ検出器が最適な選択肢となっている。

中核的運営原則

単段検出器のアーキテクチャは、通常、特徴抽出の基盤となる畳み込みニューラルネットワーク（CNN）を中心に構成される。画像がネットワークを通過するにつれ、モデルは空間的・意味的情報を符号化した特徴マップのグリッドを生成する。

初期の実装例であるシングルショット・マルチボックス検出器（SSD）は、様々なスケールで事前定義されたアンカーボックスに依存してオブジェクトの位置特定を行っていた。しかし、現代的な進歩である Ultralytics YOLO11 や最先端の YOLO26では、アンカーレス設計へと大きく移行している。これらの新しいアーキテクチャは物体の中心位置とサイズを直接予測するため、アンカーに関連する複雑なハイパーパラメータ調整が不要となる。最終出力は位置特定用の座標ベクトルと、検出された物体に対するモデルの確信度を示す信頼度スコアで構成される。

1段検出器と2段検出器の比較

これら二つの主要なカテゴリーを区別することは、特定のタスクに適したツールを選択するのに役立ちます：

ワンステージ物体検出器: 例えば Ultralytics YOLO シリーズなどのモデルは、低い推論レイテンシを優先します。これらは速度に最適化されており、ビデオストリームやモバイルアプリケーションに理想的です。最近の改良により精度差は大幅に縮まり、多くの場合、遅いモデルの精度に匹敵または上回りながらリアルタイム性能を維持しています。
二段階物体検出器:R-CNNファミリーなどのアーキテクチャは、まず領域提案を生成し、その後classify 。歴史的に、小さい物体や遮蔽された物体に対して高い精度を提供してきたが、計算コストが高く、一般的に処理速度が遅いため、時間制約のあるシナリオでの使用が制限される。

実際のアプリケーション

単段検出器の効率性は、即時応答性が極めて重要となる多様な産業分野での普及を促進してきた：

自動運転車: 自動運転車は、歩行者、交通標識、その他の車両を識別するために、映像フィードの即時処理を必要とします。この分野のリーダー企業は、複雑な環境を安全に走行するために高速ビジョンシステムに依存しており、検出と並行して物体追跡を活用することが多いです。
スマート製造: 高速組立ラインにおいて、これらのモデルは欠陥の検出や部品配置の検証をリアルタイムで実施し、自動化された品質管理を実現します。これによりボトルネックのない生産効率が確保され、多くのUltralytics 介して統合され、容易な導入が可能です。
エッジAIとIoT: その軽量性により、ワンステージ検出器はラズベリーパイや NVIDIA などのIoTデバイスに最適であり、常時クラウド接続を必要とせずに遠隔カメラやドローンに高度な知能をもたらします。

Pythonによる技術的実装

現代の高レベルAPIを用いれば、ワンステージ検出器の実装は容易である。正確な結果を得るため、モデルは複数の潜在的なボックスを予測することが多く、これらは交差率（IoU）の閾値に基づく非最大抑制（NMS）などの手法でフィルタリングされる。ただし、YOLO26のような新しいエンドツーエンドモデルでは、これがネイティブに処理される。

Python 、最先端のYOLO26モデルを読み込み、画像に対して推論を実行する方法を示しています：

from ultralytics import YOLO

# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")

# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes and labels
results[0].show()

現代的な単段アーキテクチャの利点

単段階検出器の進化は、「精度と速度」のトレードオフ克服に焦点を当ててきた。学習時のクラス不均衡に対処するため、焦点損失などの手法が導入され、モデルが豊富な背景ではなくclassify 集中するよう保証された。さらに、特徴ピラミッドネットワーク（FPN）の統合により、これらのモデルは異なるスケdetect 効果的にdetect 。

今日、研究者や開発者はUltralytics ツールを活用し、カスタムデータセット上でこれらの高度なアーキテクチャを容易に学習させられる。これによりデータアノテーションからモデル展開までのワークフローが簡素化される。農業分野であれ医療分野であれ、ワンステージ検出器の普及は強力なコンピュータビジョン技術の民主化を推進している。

One-Stage Object Detectors

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

中核的運営原則

1段検出器と2段検出器の比較

実際のアプリケーション

Pythonによる技術的実装

現代的な単段アーキテクチャの利点

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

One-Stage Object Detectors

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

中核的運営原則

1段検出器と2段検出器の比較

実際のアプリケーション

Pythonによる技術的実装

現代的な単段アーキテクチャの利点

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？ 概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

単眼深度推定とは何か？概要