Glosario

Reconocimiento de Entidades Nombradas (REN)

Desbloquea información con el Reconocimiento de Entidades Nombradas (NER). Descubre cómo la IA transforma el texto no estructurado en datos procesables para diversas aplicaciones.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Reconocimiento de Entidades Nombradas (REN) es un componente crucial de los sistemas modernos de Inteligencia Artificial (IA) y Aprendizaje Automático (AM), sobre todo en el campo del Procesamiento del Lenguaje Natural (PLN). Permite a los ordenadores identificar y categorizar automáticamente la información clave de un texto no estructurado, transformándola en un formato que las máquinas puedan comprender y utilizar fácilmente. Este proceso consiste en identificar "entidades con nombre" -palabras o frases que representan información específica- y clasificarlas en categorías predefinidas, como personas, organizaciones, lugares, fechas, etc. Al extraer estas entidades, el NER desvela información valiosa de los datos textuales, lo que lo hace indispensable para una amplia gama de aplicaciones.

Cómo funciona el reconocimiento de entidades con nombre

Los sistemas NER funcionan analizando la estructura lingüística del texto para localizar y clasificar entidades. Esto suele implicar varios pasos:

  • Tokenización: Descomponer el texto en palabras individuales o tokens.
  • Etiquetado de parte del discurso: Identificación del papel gramatical de cada palabra (por ejemplo, sustantivo, verbo, adjetivo).
  • Detección de entidades: Reconocer posibles entidades con nombre basándose en el contexto y en patrones. Por ejemplo, las palabras en mayúsculas suelen ser indicativas de entidades con nombre.
  • Clasificación de las entidades: Categorizar las entidades detectadas en tipos predefinidos utilizando modelos de aprendizaje automático entrenados en grandes cantidades de datos de texto anotados. Las categorías más comunes son:
    • Persona: Nombres de personas (por ejemplo, "Glenn Jocher").
    • Organización: Nombres de empresas, instituciones o grupos (por ejemplo, "Ultralytics").
    • Localización: Lugares geográficos (por ejemplo, "Madrid").
    • Fecha: Fechas del calendario (por ejemplo, "29 de noviembre de 2024").
    • Hora: Puntos en el tiempo (por ejemplo, "3 PM").
    • Valores numéricos: Números con significados específicos (por ejemplo, "20.000 estrellas").

Por ejemplo, en la frase "Ultralytics YOLO11 se lanzó en YOLO Visión 2024", un sistema NER identificaría "Ultralytics" como una organización, "YOLO11" como un producto, y "YOLO Visión 2024" como un evento. Los sistemas NER modernos suelen aprovechar las arquitecturas de aprendizaje profundo, en particular los transformadores, que destacan en la comprensión del contexto y los patrones complejos del lenguaje.

Relevancia y aplicaciones

La NER es una tecnología fundamental para numerosas aplicaciones basadas en la IA en diversos sectores. Su capacidad para extraer automáticamente información estructurada del texto la hace inestimable para:

  • Extracción de Información: La NER es fundamental para extraer automáticamente detalles clave de los documentos, como identificar cláusulas contractuales en documentos legales o extraer información sobre pacientes de informes de análisis de imágenes médicas.
  • Motores de búsqueda y sistemas de recomendación: Los motores de búsqueda utilizan la NER para comprender mejor la intención de las consultas de los usuarios. Por ejemplo, si un usuario busca "eventos en Madrid", la NER puede identificar "eventos" como el tipo de información buscada y "Madrid" como la ubicación, refinando así los resultados de la búsqueda. Del mismo modo, los sistemas de recomendación pueden utilizar las NER para analizar las opiniones y preferencias de los usuarios y ofrecer sugerencias más relevantes.
  • Atención al cliente: Analizar las opiniones de los clientes y los tickets de soporte mediante NER puede ayudar a las empresas a identificar problemas comunes, rastrear las menciones de productos o servicios concretos y dirigir las consultas a los departamentos adecuados, mejorando la experiencia del cliente.
  • Análisis financiero: En finanzas, el NER puede utilizarse para extraer nombres de empresas, teletipos de acciones y detalles de transacciones de artículos de noticias e informes financieros, lo que ayuda en la investigación de mercados y la gestión de riesgos.
  • Recomendación de contenidos: Los agregadores de noticias y las plataformas de contenidos utilizan la NER para categorizar artículos y sugerir contenidos relacionados a los usuarios basándose en entidades identificadas, mejorando el descubrimiento de contenidos y la participación de los usuarios, de forma similar a las tecnologías de búsqueda semántica.

Por ejemplo, en el contexto del comercio electrónico, la NER puede analizar descripciones de productos para etiquetarlos automáticamente con categorías y atributos relevantes. En visión por ordenador en agricultura, la NER podría aplicarse para analizar informes sobre la salud de los cultivos, extrayendo entidades como nombres de enfermedades o regiones afectadas para agilizar el análisis de datos y la toma de decisiones.

Diferencias clave con los conceptos afines

Aunque la NER está estrechamente relacionada con otras tareas de la PNL, tiene funciones distintas:

  • NER vs. Análisis de Sentimiento: Mientras que el NER identifica y categoriza entidades, el análisis de sentimientos se centra en determinar el tono emocional o la opinión expresada en el texto. El NER podría identificar el nombre de un producto, mientras que el análisis de sentimientos determinaría si el texto expresa un sentimiento positivo, negativo o neutro hacia ese producto.
  • NER frente a la Resumificación de Textos: La resumización de textos pretende condensar grandes volúmenes de texto en resúmenes más breves y coherentes. La NER, por el contrario, se centra en extraer fragmentos concretos de información (entidades) del texto sin resumir necesariamente todo el contenido.
  • NER y Comprensión del Lenguaje Natural (NLU): La NER es un componente de la Comprensión del Lenguaje Natural (NLU). El NLU es un campo más amplio cuyo objetivo es permitir que los ordenadores comprendan el lenguaje humano en su totalidad, incluyendo la intención, el contexto y los matices. El NER contribuye al NLU proporcionando información estructurada a nivel de entidad que ayuda a la comprensión lingüística global.

Tecnologías y herramientas

Varias herramientas y plataformas facilitan el desarrollo y la implantación de sistemas NER. Hugging Face proporciona una amplia gama de modelos y bibliotecas de transformadores preentrenados que resultan muy eficaces para las tareas de NER. Plataformas como Ultralytics HUB ofrecen herramientas e infraestructura para entrenar, desplegar y gestionar modelos de IA, incluidos los utilizados para NER, agilizando la integración de las capacidades de NER en soluciones de IA más amplias. Ultralytics YOLO Los modelos de Inteligencia Artificial, conocidos sobre todo por la detección de objetos, pueden integrarse con canalizaciones de PNL para crear sistemas completos que comprendan tanto los datos visuales como los textuales, lo que aumenta aún más la versatilidad de la NER en las aplicaciones multimodales.

Leer todo