Glossaire

Détection d'objets

Découvre la puissance de la détection d'objets - identifie et localise les objets dans les images ou les vidéos avec des modèles de pointe comme YOLO. Explore les applications du monde réel !

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La détection d'objets est une tâche fondamentale de la vision par ordinateur (VA) qui consiste à identifier la présence, l'emplacement et le type d'un ou de plusieurs objets dans une image ou une vidéo. Contrairement à la classification d'images, qui attribue une seule étiquette à l'ensemble de l'image, la détection d'objets délimite précisément chaque instance d'objet à l'aide d'une boîte englobante et lui attribue une étiquette de classe. Cette capacité permet aux machines de comprendre les scènes visuelles avec une plus grande granularité, reflétant ainsi plus fidèlement la perception visuelle humaine.

Comment fonctionne la détection d'objets

La détection d'objets combine généralement deux tâches essentielles : la classification des objets (déterminer "quel" objet est présent) et la localisation des objets (déterminer "où" l'objet est situé). Les systèmes modernes de détection d'objets s'appuient fortement sur l'apprentissage profond (DL), en particulier les réseaux neuronaux convolutifs (CNN). Ces réseaux sont formés sur de grands ensembles de données, tels que le populaire ensemble de données COCO, pour apprendre les caractéristiques et les modèles associés aux différentes classes d'objets. Le modèle traite une image d'entrée et produit une liste de boîtes de délimitation, chacune avec une étiquette de classe associée (par exemple, "voiture", "personne") et un score de confiance. Les performances de ces modèles sont souvent mesurées à l'aide de paramètres tels que l'intersection sur l'union (IoU ) et la précision moyenne (mAP).

Détection d'objets et tâches connexes

Il est important de distinguer la détection d'objets des autres tâches de vision par ordinateur :

  • Classification d'images: Attribue une seule étiquette à une image entière (par exemple, "Cette image contient un chat"). Elle ne fournit pas d'informations sur l'emplacement du ou des objets.
  • Segmentation d'image: Classifie chaque pixel d'une image. La segmentation sémantique attribue une étiquette de classe à chaque pixel (par exemple, tous les pixels appartenant à des voitures sont étiquetés "voiture"), tandis que la segmentation d'instance fait la distinction entre différentes instances de la même classe (par exemple, en étiquetant "voiture 1", "voiture 2"). La segmentation fournit des informations spatiales plus détaillées que les boîtes de délimitation de la détection d'objets.

Types de modèles de détection d'objets

Les modèles de détection d'objets se divisent généralement en deux catégories :

  • Détecteurs à deux niveaux : Ces modèles proposent d'abord des régions d'intérêt (RdI) où les objets pourraient se trouver, puis classent les objets dans ces régions. La famille R-CNN(Region-based CNN) en est un exemple. Ils atteignent souvent une grande précision mais peuvent être plus lents.
  • Détecteurs à une étape : Ces modèles effectuent la localisation et la classification en un seul passage directement sur la grille de l'image. Exemples Ultralytics YOLO d'Ultralytics comme YOLOv8 et YOLOv11. Ils sont généralement plus rapides, ce qui les rend adaptés à l'inférence en temps réel. Des approches plus récentes, comme les détecteurs sans ancrage, simplifient encore le processus de détection. Tu peux explorer les comparaisons entre les différents modèles YOLO pour comprendre leurs compromis.

Applications dans le monde réel

La détection d'objets est cruciale pour de nombreuses applications dans divers secteurs d'activité :

  • Systèmes autonomes : Permettre aux véhicules de l'IA dans les voitures auto-conduites de détecter les piétons, les autres véhicules, les panneaux de signalisation et les obstacles pour une navigation en toute sécurité. La technologie de Waymo repose en grande partie sur une détection sophistiquée des objets.
  • Surveillance et sécurité : Surveiller les zones pour détecter les accès non autorisés, détecter les activités suspectes ou mettre en place des systèmes d'alarme de sécurité automatisés.
  • Retail Analytics : Suivre les produits dans les rayons pour une gestion des stocks pilotée par l'IA, analyser le trafic piétonnier des clients et améliorer les processus de passage en caisse.
  • Soins de santé : Aide à l'analyse des images médicales en identifiant les tumeurs, les lésions ou d'autres anomalies dans les scanners comme les rayons X ou les IRM. Recherche publiée dans des revues telles que Radiology : Artificial Intelligence présentent souvent de telles applications.
  • Agriculture : Surveiller la santé des cultures, détecter les parasites et automatiser les processus de récolte grâce aux solutions d'IA dans l'agriculture.

Outils et formation

Le développement de modèles de détection d'objets implique l'utilisation d'outils et de plateformes spécialisés. Des outils comme PyTorch et TensorFlow fournissent les éléments de base. Des bibliothèques comme OpenCV offrent des fonctions essentielles de vision par ordinateur. Ultralytics fournit une technologie de pointe Ultralytics YOLO et la plateforme Ultralytics HUB, ce qui simplifie le processus de formation des modèles personnalisés, la gestion des ensembles de données et le déploiement efficace des solutions. Un entraînement efficace des modèles nécessite souvent un réglage minutieux des hyperparamètres et des stratégies d'augmentation des données.

Tout lire