Glossaire

Reconnaissance d'images

Découvrez comment la reconnaissance d'images permet à l'IA de classer et de comprendre les éléments visuels, ce qui favorise l'innovation dans les domaines de la santé, de la vente au détail, de la sécurité, etc.

La reconnaissance d'images est un vaste domaine de la vision par ordinateur qui permet aux machines d'identifier et d'interpréter des objets, des personnes, des lieux et des actions dans des images numériques ou des vidéos. Il s'agit d'une technologie fondamentale qui alimente d'innombrables applications, depuis le déverrouillage de votre téléphone avec votre visage jusqu'à la navigation de véhicules autonomes dans des environnements complexes. À la base, la reconnaissance d'images utilise des algorithmes d'apprentissage machine (ML) et d'apprentissage profond (DL) pour analyser les pixels et extraire des modèles significatifs, imitant ainsi la capacité humaine à comprendre les informations visuelles.

Reconnaissance d'images et tâches connexes

Bien qu'elle soit souvent utilisée de manière interchangeable, la reconnaissance d'images est un terme général qui englobe plusieurs tâches plus spécifiques. Il est important de le distinguer de ses sous-domaines :

  • Classification des images: Il s'agit de la forme la plus simple de reconnaissance d'images. Elle consiste à attribuer une étiquette unique à l'ensemble d'une image à partir d'un ensemble prédéfini de catégories. Par exemple, un modèle peut classer une image comme contenant un "chat", un "chien" ou une "voiture". Le résultat est une seule étiquette pour l'ensemble de l'image.
  • Détection d'objets: Tâche plus avancée, la détection d'objets permet non seulement de classer les objets dans une image, mais aussi de les localiser, généralement en traçant une boîte englobante autour de chacun d'entre eux. Une voiture autonome, par exemple, utilise la détection d'objets pour identifier et localiser les piétons, les autres véhicules et les panneaux de signalisation.
  • Segmentation d'images: Cette tâche va plus loin en identifiant les pixels précis appartenant à chaque objet d'une image. Elle crée un masque détaillé pour chaque objet, ce qui est crucial pour les applications nécessitant une compréhension approfondie de la forme et des limites d'un objet, comme dans l'analyse d'images médicales.

Comment fonctionne la reconnaissance d'images

La reconnaissance d'images moderne est principalement assurée par des réseaux neuronaux convolutifs (CNN), un type de réseau neuronal particulièrement efficace pour traiter des données en forme de grille telles que les images. Le processus implique généralement

  1. Collecte des données : Un grand ensemble de données d'images étiquetées est rassemblé. Les exemples les plus connus sont ImageNet et COCO.
  2. Entraînement du modèle : Le CNN est entraîné sur cet ensemble de données. Au cours de la formation, le réseau apprend à identifier les modèles (des simples arêtes et textures aux parties d'objets complexes) par le biais d'un processus appelé " extraction de caractéristiques". Les poids du modèle sont ajustés pour minimiser la différence entre ses prédictions et les étiquettes de référence.
  3. Inférence : Une fois entraîné, le modèle peut faire des prédictions sur de nouvelles images. Ce processus d'application d'un modèle entraîné est appelé inférence.

Applications dans le monde réel

La reconnaissance d'images fait désormais partie intégrante de nombreuses industries :

  • Santé : Dans le domaine de l'IA en santé, la reconnaissance d'images aide les radiologues à détecter les tumeurs, les fractures et d'autres anomalies dans les radiographies, les IRM et les tomodensitogrammes. Par exemple, des modèles peuvent être formés sur des ensembles de données d'images médicales pour identifier les tumeurs cérébrales avec une grande précision, aidant ainsi les médecins à établir des diagnostics plus rapides.
  • Commerce de détail : Les détaillants utilisent la reconnaissance d'images pour la gestion des stocks en utilisant des caméras pour surveiller les rayons et détecter les ruptures de stock. Les fonctions de recherche visuelle sur les sites de commerce électronique, qui permettent aux clients de télécharger une photo pour trouver des produits similaires, sont une autre application populaire. Pour en savoir plus, consultez notre page sur l'IA dans le commerce de détail.

Outils et formation

Le développement d'applications de reconnaissance d'images implique souvent l'utilisation de bibliothèques et de cadres spécialisés. Les technologies clés sont les suivantes

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers