Glossaire

Reconnaissance des entités nommées (NER)

Débloque des informations grâce à la reconnaissance des entités nommées (NER). Découvre comment l'IA transforme le texte non structuré en données exploitables pour diverses applications.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La reconnaissance des entités nommées (NER) est une tâche fondamentale du traitement du langage naturel (NLP) et un élément clé de l'intelligence artificielle (AI) moderne. Elle consiste à identifier et à classer automatiquement des éléments d'information spécifiques - appelés "entités nommées" - dans un texte non structuré. Ces entités représentent généralement des objets du monde réel tels que des personnes, des organisations, des lieux, des dates, des noms de produits, des valeurs monétaires, etc. L'objectif principal de la NER est de transformer le texte brut en données structurées, ce qui facilite la compréhension, le traitement et l'extraction par les machines d'informations précieuses pour divers cas d'utilisation de l'IA.

Comment fonctionne la reconnaissance des entités nommées ?

Les systèmes NER analysent la structure linguistique et le contexte du texte pour localiser et catégoriser les entités. Alors que les premiers systèmes s'appuyaient fortement sur des règles grammaticales et des dictionnaires (une forme d'IA symbolique), les approches modernes tirent parti de l'apprentissage automatique (ML), en particulier de l 'apprentissage profond (DL). Des modèles comme Transformers, que l'on trouve souvent sur des plateformes telles que Hugging Face, excellent dans la compréhension du contexte et des schémas linguistiques subtils, ce qui conduit à une plus grande précision. Le processus consiste généralement à identifier des entités potentielles (mots ou phrases) à l'aide de techniques souvent liées à la tokenisation, puis à les classer dans des catégories prédéfinies (par exemple, PERSONNE, ORGANISATION, LIEU, DATE, DIVERS). Cette classification s'appuie sur des caractéristiques apprises au cours de la formation sur de grands ensembles de données, souvent annotés spécifiquement pour les tâches de NER.

Par exemple, dans la phrase "Le 4 juillet, Sarah Jones a visité la Tour Eiffel alors qu'elle représentait Acme Corp", un système NER identifierait :

  • "4 juillet" comme DATE
  • "Sarah Jones" en tant que PERSONNE
  • "Tour Eiffel" comme LOCATION
  • "Acme Corp" en tant qu'ORGANISATION

Ce résultat structuré est beaucoup plus utile pour les tâches en aval comme l'analyse des données ou l'alimentation d'un graphe de connaissances que le texte original seul. Tu peux explorer une étude sur les techniques de NER pour obtenir des informations techniques plus approfondies.

Pertinence et applications

Le NER est une technologie de base qui permet de nombreuses applications dans divers domaines en structurant les informations textuelles :

  • Extraction d'informations : Extraire automatiquement des détails clés de documents tels que des articles de presse, des rapports ou des courriels. Par exemple, extraire les noms des entreprises, les titres des dirigeants et les emplacements à partir des flux d'actualités financières.
  • Catégorisation du contenu et recommandation : Étiqueter les articles ou les posts avec des entités pertinentes pour améliorer l'organisation et alimenter les systèmes de recommandation.
  • Soutien à la clientèle : Analyser les commentaires des clients ou les tickets d'assistance pour identifier les produits mentionnés, les lieux ou les problèmes spécifiques, ce qui permet un acheminement et une résolution plus rapides. Imagine un système étiquetant automatiquement les courriels d'assistance mentionnant "iPhone 16" et "magasin de New York".
  • Santé : Rationaliser la gestion des dossiers médicaux en extrayant les noms des patients, les diagnostics, les médicaments et les dosages des notes cliniques, contribuant ainsi à des domaines tels que l'analyse d'images médicales lorsqu'ils sont combinés à des rapports.
  • Recherche sémantique: Améliorer les moteurs de recherche pour qu'ils comprennent le sens des requêtes en reconnaissant les entités qui s'y trouvent (par exemple, la recherche de "restaurants près du Louvre" nécessite d'identifier "Louvre" en tant que LOCATION). Des outils tels que Google Cloud Natural Language AI offrent des capacités de recherche sémantique.
  • Analyse financière : Extraire les noms des entreprises, les valeurs monétaires et les dates des rapports financiers pour l'analyse du marché et la modélisation prédictive.
  • Conformité et sécurité : Identifier les informations sensibles comme les noms ou les adresses dans les documents pour assurer la confidentialité des données et la conformité avec les réglementations comme le GDPR.

La gestion du cycle de vie ML des modèles NER, y compris l'annotation des données et le déploiement des modèles, peut être facilitée par des plateformes comme Ultralytics HUB.

Principales différences avec les concepts apparentés

Le NER est souvent utilisé en même temps que d'autres tâches NLP, mais il a un objectif distinct :

  • Analyse de sentiment: Détermine le ton émotionnel (positif, négatif, neutre) exprimé dans un texte. Le NER identifie ce qui est discuté, tandis que l'analyse de sentiment identifie ce que l'auteur ressent à ce sujet.
  • Résumés de textes: Vise à créer une version plus courte d'un texte tout en préservant les informations clés. Le NER extrait des mentions d'entités spécifiques, et non un aperçu condensé de l'ensemble du texte.
  • Détection d'objets: Une tâche de vision artificielle (CV) qui identifie et localise les objets dans les images à l'aide de boîtes de délimitation. Le NER fonctionne uniquement sur des données textuelles, et non sur des données visuelles telles que le texte. Ultralytics YOLO d'Ultralytics pour les tâches de détection.
  • Compréhension du langage naturel (NLU): Un domaine plus large qui englobe la compréhension globale du sens du texte, y compris la reconnaissance de l'intention, l'extraction des relations et la résolution des coréférences. La NER est une sous-tâche spécifique de la NLU qui se concentre uniquement sur l'identification et la classification des entités.
  • Extraction de mots-clés: Identifie les termes ou les phrases importants dans un texte, qui peuvent être ou non des entités nommées. La NER recherche spécifiquement des catégories prédéfinies telles que les personnes, les lieux et les organisations.

Il est essentiel de comprendre ces distinctions pour choisir la bonne technique de PNL pour un problème donné, comme le soulignent des guides tels que Étapes d'un projet de vision par ordinateur (bien que centré sur le CV, les principes s'appliquent).

Tout lire