物体検出の基礎を探求しましょう。Ultralytics 、比類のない速度と精度でリアルタイムに物体を識別・位置特定する仕組みを学びます。
物体検出は、コンピュータビジョン(CV)分野における中核技術であり、コンピュータシステムが視覚データ内の特定項目を識別・位置特定することを可能にする。画像全体に単一のラベルを割り当てる単純な画像分類タスクとは異なり、物体検出は物体のクラス(例:「人物」、「自動車」、「犬」)とその空間的位置を同時に予測することで、詳細な理解を提供する。 この位置情報は通常、対象物を囲む矩形の境界ボックスで表現され、モデルの確信度を示す信頼度スコアが伴う。この認識と位置特定という二重の能力は、現代の人工知能(AI)アプリケーションの感覚的基盤として機能し、機械が環境と意味のある相互作用を行うことを可能にする。
現代の検出器は、入力画像から複雑な特徴を抽出するために、深層学習(DL)アーキテクチャ、特に畳み込みニューラルネットワーク(CNN)に大きく依存している。このプロセスは、COCO 大規模なラベル付きコレクションを用いてパターン認識を学習するトレーニングフェーズから始まる。このフェーズにおいて、アルゴリズムは予測誤差を最小化するためにモデルの重みを最適化する。
モデルが推論用にデプロイされると、新しい画像をスキャンして潜在的な物体を提案します。その後、高度なアルゴリズムが非最大抑制(NMS)を適用し、重複検出をフィルタリングすることで、各個別のエンティティが一度だけ強調表示されるようにします。これらの予測の精度は、予測ボックスと真値の重なりを測定する交差率(IoU)メトリクスを用いて評価されることがよくあります。 近年の進歩により、YOLO26のようなエンドツーエンドアーキテクチャが実現され、この処理パイプラインを合理化。これにより、エッジデバイス上で卓越した速度とリアルタイム推論能力が達成されている。
プロジェクトに適したツールを選択するためには、物体検出を関連概念と区別することが極めて重要です:
物体検出の汎用性は主要産業全体で革新を推進している。自動車分野では、 自動運転車両のAIは歩行者、交通標識、他車両を瞬時に識別し安全に走行するため、 検出モデルに決定的に依存している。車載カメラからの映像処理により、 これらのシステムは事故を防ぐ瞬時の判断を下す。
小売分野におけるAIのもう一つの顕著な活用例が存在する。 自動レジシステムやスマート在庫管理ロボットは、物体検出技術を用いて棚をスキャンし、商品を認識し、 detect や誤配置品detect 。この自動化によりサプライチェーンが効率化され、 商品の常時確保が保証されることで顧客体験が向上する。
開発者は、 ultralytics Python 。以下の
例は、事前学習済みモデルを読み込む方法を示しています。 YOLO26 モデル
そして画像に対して推論を実行する。
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
業務の拡大を目指すチーム向けに、 Ultralytics 包括的な環境を提供します。 データへのアノテーション、クラウド上でのカスタムモデルのトレーニング、 そしてONNXやPyTorch、TensorFlowなどの様々な形式へのデプロイが可能です。 ONNX や TensorRTといった様々な形式にデプロイするための包括的な環境を提供します。このようなプラットフォームを活用することで、MLOpsライフサイクルが簡素化され、エンジニアはインフラ管理ではなくアプリケーションの改良に集中できるようになります。