Glossaire

Tête de détection

Découvrez comment une tête de détection permet la détection d'objets en temps réel. Explorez son rôle dans Ultralytics pour prédire les cadres de sélection et les étiquettes avec une grande précision.

Une tête de détection agit comme la couche décisionnelle finale dans une architecture de réseau neuronal de détection d'objets . Alors que les couches précédentes du modèle sont chargées de comprendre les formes, les textures et les caractéristiques d'une image, la tête de détection est le composant spécifique qui interprète ces informations afin de prédire avec précision quels objets sont présents et où ils se trouvent. Elle transforme les données abstraites de haut niveau produites par l' extracteur de caractéristiques en résultats exploitables, générant généralement un ensemble de rectangles englobant les objets identifiés, ainsi que leurs étiquettes de classe et leurs scores de confiance correspondants.

Distinguer la tête de la colonne vertébrale et du cou

Pour bien comprendre le fonctionnement d'une tête de détection, il est utile de visualiser les détecteurs modernes comme étant composés de trois étapes principales, chacune ayant un objectif distinct dans le pipeline de vision par ordinateur (CV):

Backbone : Il s'agit de la partie initiale du réseau, souvent un réseau neuronal convolutif (CNN) tel que ResNet ou CSPNet. Il traite l'image brute en entrée pour créer des cartes de caractéristiques qui représentent des modèles visuels.
Cou : Situé entre la colonne vertébrale et la tête, le cou affine et combine les caractéristiques de différentes échelles. Des architectures telles que le réseau pyramidal des caractéristiques (FPN) garantissent que le modèle peut detect de tailles variables en agrégeant le contexte.
Tête : composante finale qui utilise les caractéristiques affinées provenant du cou. Elle effectue la tâche réelle de classification (qu'est-ce que c'est ?) et de régression (où est-ce ?).

Évolution : basée sur des ancres ou sans ancres

La conception des têtes de détection a considérablement évolué pour améliorer la vitesse et la précision, en particulier avec la transition des méthodes traditionnelles vers les modèles d'inférence en temps réel modernes.

Têtes basées sur des ancrages : les détecteurs d'objets traditionnels à un seul niveau s'appuyaient sur des boîtes d'ancrageprédéfinies, c'est-à-dire des formes de référence fixes de différentes tailles. La tête prédisait alors dans quelle mesure étirer ou déplacer ces ancrages pour s'adapter à l'objet. Cette approche est décrite en détail dans les recherches fondamentales sur Faster R-CNN.
Têtes sans ancrage : les modèles de pointe, y compris le dernier YOLO26, utilisent des détecteurs sans ancrage. Ces têtes prédisent les centres et les dimensions des objets directement à partir des pixels des cartes de caractéristiques, éliminant ainsi le besoin d'un réglage manuel des ancrages . Cela simplifie l'architecture et améliore la capacité du modèle à généraliser de nouvelles formes d'objets, une technique souvent associée à la détection d'objets en une seule étape entièrement convolutive (FCOS).

Applications concrètes

La précision de la tête de détection est essentielle pour déployer l' intelligence artificielle (IA) dans des environnements industriels et critiques pour la sécurité. Les utilisateurs peuvent facilement annoter les données et former ces têtes spécialisées à l'aide de la Ultralytics .

Conduite autonome : dans le domaine de l' IA appliquée à l'automobile, la tête de détection est chargée de distinguer en temps réel les piétons, les feux de signalisation et les autres véhicules. Une tête hautement optimisée garantit que la latence d'inférence reste suffisamment faible pour que le véhicule puisse réagir instantanément.
Diagnostic médical : dans le domaine de l'analyse d'images médicales, les têtes de détection sont réglées avec précision pour localiser des anomalies telles que des tumeurs dans les IRM. La branche de régression doit être extrêmement précise pour délimiter exactement les contours d'une lésion, afin d'aider les médecins dans leurs solutions de soins de santé.

Exemple de code

L'exemple suivant montre comment charger un YOLO26 modèle et inspecte la sortie de sa tête de détection. Lorsque l'inférence s'exécute, la tête traite l'image et renvoie le résultat final. boxes contenant les coordonnées et les identifiants de classe.

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")

# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
    # Print the bounding box coordinates and the predicted class
    print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")

Cette interaction met en évidence la manière dont la tête de détection traduit les activations complexes du réseau neuronal en données lisibles que les développeurs peuvent utiliser pour des tâches en aval telles que le suivi ou le comptage d'objets.

Tête de détection

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Distinguer la tête de la colonne vertébrale et du cou

Évolution : basée sur des ancres ou sans ancres

Applications concrètes

Exemple de code

En savoir plus dans cette catégorie

12 cas d'utilisation de l'imagerie aérienne grâce à la vision par ordinateur

Qu'est-ce que l'estimation monoculaire de la profondeur ? Aperçu général

Un aperçu de l'utilisationYOLO Ultralytics pour la détection des menaces par l'IA

Rejoindre la communauté Ultralytics