Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Détecteurs basés sur des ancres

Découvrez comment les détecteurs basés sur des ancres utilisent des cadres de sélection prédéfinis pour la détection d'objets. Apprenez leurs mécanismes fondamentaux, leurs cas d'utilisation concrets et comparez-les au système moderne et plus rapide Ultralytics .

Les détecteurs basés sur des ancrages constituent une catégorie fondamentale de modèles de détection d'objets en vision par ordinateur qui utilisent un ensemble de cadres de sélection prédéfinis pour localiser et classify . Au lieu d'essayer de prédire les coordonnées d'un objet à partir d'une page blanche, ces systèmes commencent par des modèles de référence fixes appelés cadres d'ancrage. Le réseau neuronal est ensuite entraîné à déterminer lequel de ces modèles correspond le mieux à un objet dans l'image et à calculer les décalages spécifiques (ajustements de position et de taille) nécessaires pour aligner parfaitement l'ancrage avec la cible. Cette approche transforme le problème difficile de la prédiction arbitraire des coordonnées en une tâche de régression plus stable, ce qui a constitué une avancée majeure dans le développement des premières architectures d'apprentissage profond (DL) telles que Faster R-CNN et SSD.

Comment fonctionnent les mécanismes basés sur les ancres

Le fonctionnement de base d'un détecteur basé sur des ancres consiste à diviser l'image d'entrée en une grille dense. À chaque cellule de cette grille, le modèle génère plusieurs boîtes d'ancrage avec différentes échelles et proportions afin de prendre en compte différentes formes d'objets, tels que des piétons de grande taille ou des véhicules larges. Lorsque les données d'image passent par la colonne vertébrale du modèle, le réseau extrait des caractéristiques riches afin d'effectuer deux tâches simultanées :

  1. Classification : le modèle attribue un score de probabilité à chaque ancre, prédisant s'il contient une classe spécifique d'objets (par exemple, « voiture », « chien ») ou s'il s'agit simplement de bruit de fond.
  2. Régression par boîte : Pour les ancres identifiées comme contenant un objet, le réseau prédit des facteurs de correction afin d'affiner le centre de l'ancre. x, y coordonnées, largeur et hauteur, ce qui donne un résultat compact. boîte englobante.

Pendant l'entraînement du modèle, ces détecteurs utilisent une métrique appelée Intersection over Union (IoU) pour faire correspondre les ancres prédéfinies avec les étiquettes de vérité terrain fournies dans l'ensemble de données. Les ancres présentant un chevauchement élevé sont traitées comme des échantillons positifs. Étant donné que ce processus génère des milliers de détections potentielles, un algorithme de filtrage appelé Non-Maximum Suppression (NMS) est appliqué pendant l'inférence afin d'éliminer les boîtes redondantes et de ne conserver que la prédiction la plus précise pour chaque objet.

Comparaison avec les détecteurs sans ancre

Alors que les méthodes basées sur des ancres ont établi la norme pendant des années, le domaine a évolué vers des détecteurs sans ancres. Comprendre la distinction est vital pour les praticiens modernes.

  • Basé sur des ancres : modèles tels que YOLOv5 et le RetinaNet original s'appuient sur une configuration manuelle ou des algorithmes de regroupement tels que le regroupement k-means pour déterminer les meilleures tailles d'ancrage pour un ensemble de données. Cela offre une certaine stabilité, mais peut s'avérer rigide si les objets varient considérablement en termes de forme.
  • Sans ancrage : les architectures modernes, notamment YOLO26, suppriment souvent complètement l'étape d'ancrage. Elles prédisent directement les centres et les tailles des objets à partir des pixels de la carte des caractéristiques, ce qui réduit la charge de calcul et simplifie la recherche d'hyperparamètres. Cette approche « de bout en bout » est généralement plus rapide et plus facile à former sur des données diverses.

Applications concrètes

La logique basée sur les ancrages reste pertinente dans de nombreux systèmes de production hérités et spécialisés où les formes des objets sont prévisibles et cohérentes.

  • Surveillance du trafic : dans les systèmes de transport intelligents, des caméras detect afin de gérer le flux ou d'identifier les infractions. Les voitures et les camions ayant des dimensions standardisées, les modèles basés sur des ancres peuvent être ajustés avec des a priori spécifiques afin de maximiser la précision et le rappel.
  • Automatisation dans le commerce de détail : les systèmes de caisse automatisés utilisent la vision par ordinateur pour identifier les produits. Étant donné que les produits emballés, tels que les boîtes de céréales, ont un format fixe, les ancres fournissent une base solide au réseau, l'aidant à distinguer les articles d'apparence similaire dans un environnement encombré.

Exemple de mise en œuvre

Alors que les derniers modèles YOLO26 utilisent des têtes sans ancrage pour des performances supérieures, l'interface pour la détection reste cohérente. Ultralytics et Python masquent la complexité liée à l'utilisation d'ancrages ou de points centraux par un modèle, permettant ainsi aux utilisateurs de se concentrer sur les résultats.

Voici comment charger un modèle et exécuter une inférence pour detect , un workflow qui s'applique quelle que soit l'architecture d'ancrage sous-jacente :

from ultralytics import YOLO

# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes
results[0].show()

Pour en savoir plus

Pour approfondir votre compréhension des mécanismes de détection, explorez les recherches fondamentales sur Faster R-CNN qui a introduit le Region Proposal Network (RPN), ou lisez des articles sur le Single Shot MultiBox Detector (SSD), qui a optimisé la détection basée sur les ancres pour plus de rapidité. Pour une vision plus large du domaine, l' COCO sert de référence standard pour évaluer à la fois les modèles basés sur des ancrages et ceux sans ancrages. De plus, les cours avancés sur Coursera couvrent souvent les détails mathématiques de la régression des boîtes et de la correspondance des ancrages.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant