Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Reconnaissance d'entités nommées (NER)

Découvrez la reconnaissance d'entités nommées (NER) dans le traitement du langage naturel (NLP). Apprenez à identifier et à classify des entités classify telles que les noms et les dates afin d'obtenir des informations pertinentes grâce à l'IA et à Ultralytics .

La reconnaissance d'entités nommées (NER) est une sous-tâche fondamentale du traitement du langage naturel (NLP) qui consiste à identifier et à classer les informations clés dans un texte non structuré. Dans un flux de travail type, un modèle NER analyse un document afin de localiser des « entités » (mots ou expressions spécifiques représentant des objets du monde réel) et les attribue à des catégories prédéfinies telles que les noms de personnes, d'organisations, de lieux, de dates ou de codes médicaux. Ce processus est essentiel pour transformer des données brutes et non structurées telles que des e-mails, des avis clients et des articles d'actualité en formats structurés que les machines peuvent traiter et analyser. En répondant aux questions « qui, quoi et où » d'un texte, le NER permet aux systèmes d'intelligence artificielle (IA) d' extraire automatiquement des informations significatives à partir de vastes quantités de données.

Comment fonctionne le NER

Les systèmes NER modernes exploitent des modèles statistiques avancés et des techniques d'apprentissage profond (DL) pour comprendre le contexte entourant un mot. Le processus commence par la tokenisation, qui consiste à décomposer une phrase en unités individuelles appelées tokens. Des architectures sophistiquées, telles que le Transformer, analysent ensuite les relations entre ces tokens afin de déterminer leur signification en fonction de leur utilisation.

Par exemple, le mot « Apple » peut désigner un fruit ou une entreprise technologique selon le contexte. Grâce à des mécanismes tels que l'auto-attention, un modèle NER distingue que « Apple a lancé un nouveau téléphone » fait référence à une organisation, tandis que « J'ai mangé une pomme » fait référence à un objet générique. Les performances de ces modèles dépendent fortement de la qualité des données d'entraînement et de la précision des annotations de données. Dans les applications multimodales, le NER est souvent associé à la reconnaissance optique de caractères (OCR) afin d'extraire le texte des images avant de le traiter.

Applications concrètes

La technologie NER est une technologie fondamentale pour de nombreux outils d'automatisation intelligente utilisés dans divers secteurs.

  • L'IA dans le domaine de la santé: les établissements médicaux utilisent la NER pour extraire des données critiques des dossiers médicaux électroniques. En extrayant des entités telles que les symptômes, les noms de médicaments et les posologies des notes cliniques, les chercheurs peuvent accélérer la découverte de médicaments et améliorer les soins prodigués aux patients.
  • Assistance client intelligente : les entreprises utilisent des chatbots équipés de la technologie NER pour classify automatiquement les réclamations des clients. Si un utilisateur envoie le message « L'écran de mon ordinateur portable est cassé », le système identifie « ordinateur portable » comme un produit et « écran cassé » comme un défaut, et transmet immédiatement le ticket à l'équipe d'assistance technique .
  • Recommandation de contenu : les services de streaming et les agrégateurs d'actualités utilisent le NER pour baliser le contenu avec des entités pertinentes (par exemple, acteurs, genres, lieux). Les systèmes de recommandation utilisent ensuite ces balises pour suggérer de nouveaux films ou articles correspondant aux intérêts de l'utilisateur.
  • Analyse financière : les sociétés d'investissement utilisent le NER pour analyser quotidiennement des milliers de rapports financiers et d'articles d'actualité. En extrayant les noms des entreprises et les valeurs monétaires, elles peuvent réaliser des modèles prédictifs afin de prévoir les tendances du marché .

Distinguer le NER des concepts connexes

Il est utile de différencier la NER des autres tâches d'interprétation afin de comprendre son rôle spécifique dans un pipeline d'IA.

  • Détection d'objets: alors que le NER identifie des entités dans un texte, la détection d'objets identifie des entités dans des images. Par exemple, un modèle visuel tel que YOLO26 détecte les voitures et les piétons dans des flux vidéo, tandis que le NER détecte « Ford » et « conducteur » dans des rapports écrits. Ces deux tâches visent à localiser et à classify d'intérêt dans leurs modalités de données respectives.
  • Analyse des sentiments: cette tâche détermine le ton émotionnel (positif, négatif ou neutre) d'un texte. Le NER extrait ce dont il est question (par exemple, « l'iPhone 16 »), tandis que l'analyse des sentiments détermine ce que l'utilisateur en pense (par exemple, « est incroyable »).
  • Compréhension du langage naturel (NLU): La NLU est un terme générique plus large qui désigne la compréhension de la lecture automatique. La NER est une composante spécifique de la NLU qui fonctionne souvent en parallèle avec la classification des intentions afin de saisir pleinement le sens de la saisie d'un utilisateur.
  • Extraction de mots-clés : Contrairement à la NER, qui classe les mots dans des catégories sémantiques (par exemple, Personne, Date), l'extraction de mots-clés identifie simplement les termes les plus fréquents ou les plus pertinents dans un document sans comprendre leur type d'entité.

Combiner la NER avec la vision par ordinateur

La convergence entre le texte et la vision est une tendance croissante dans l' apprentissage multimodal. Des modèles tels que YOLO comblent cette lacune en utilisant des invites textuelles pour guider la détection d'objets. Dans ce flux de travail, l'encodeur de texte agit de manière similaire à un système NER, en interprétant la signification sémantique des noms de classes (entités) fournis par l'utilisateur pour trouver les objets visuels correspondants.

L'exemple Python suivant montre comment utiliser la fonction ultralytics bibliothèque permettant de detect à partir de descriptions textuelles personnalisées, reliant efficacement des entités en langage naturel à des données visuelles.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text-based entities
model = YOLOWorld("yolov8s-world.pt")

# Define custom entities to search for in the image
# The model interprets these text strings to identify visual matches
model.set_classes(["red backpack", "person wearing hat", "dog"])

# Run inference on an image to localize these entities
results = model.predict("park_scene.jpg")

# Display the results with bounding boxes around detected entities
results[0].show()

Outils et implémentation

Les développeurs ont accès à un écosystème robuste d'outils pour la mise en œuvre de la NER. Des bibliothèques open source populaires telles que spaCy et NLTK fournissent des pipelines pré-entraînés pour une utilisation immédiate. Pour les applications à l'échelle de l'entreprise, des services cloud tels que Google Natural Language offrent des API gérées qui s'adaptent à la demande.

La gestion du cycle de vie de ces modèles d'IA, qu'ils soient destinés au traitement du texte ou à la vision, nécessite des opérations efficaces. Ultralytics simplifie ces processus MLOps en offrant un environnement unifié pour gérer les ensembles de données, former les modèles et déployer les solutions. Cela garantit que les projets d'IA restent évolutifs et prêts à être mis en production, favorisant ainsi l'amélioration continue de modèles tels que YOLO26 pour des performances de pointe.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant