Glosario

Procesamiento del Lenguaje Natural (PLN)

Descubre los conceptos, técnicas y aplicaciones del Procesamiento del Lenguaje Natural (PLN), como los chatbots, el análisis de sentimientos y la traducción automática.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Procesamiento del Lenguaje Natural (PLN) es un campo dinámico dentro de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM) dedicado a capacitar a los ordenadores para comprender, procesar, interpretar y generar lenguaje humano, tanto texto como voz. Combina principios de la lingüística computacional con modelos estadísticos, ML y modelos de Aprendizaje Profundo (DL) para salvar la distancia entre la comunicación humana y la comprensión informática. El objetivo final es permitir que las máquinas interactúen con el lenguaje de forma significativa y útil, automatizando tareas que tradicionalmente requieren capacidades lingüísticas humanas.

Conceptos clave de la PNL

La PNL implica varias tareas básicas que descomponen las complejidades del lenguaje en componentes que las máquinas pueden analizar y sobre los que pueden actuar:

  • Tokenización: El paso inicial de descomponer el texto en unidades más pequeñas, como palabras o subpalabras (tokens).
  • Reconocimiento de Entidades Nombradas (REN): Identificar y categorizar entidades clave en el texto, como nombres de personas, organizaciones, lugares, fechas y valores monetarios.
  • Análisis de Sentimiento: Determinar el tono emocional o la opinión subjetiva expresada en un texto (por ejemplo, positivo, negativo, neutro).
  • Traducción automática: Traducir automáticamente texto o voz de un idioma a otro, como se hace con herramientas como Google Translate.
  • Modelado del Lenguaje: Construcción de modelos que predicen la probabilidad de una secuencia de palabras, crucial para tareas como la generación de textos y el reconocimiento del habla.

Cómo funciona la PNL

Los sistemas de PLN suelen emplear un enfoque de canalización. Los datos de texto sin procesar se someten primero a un preprocesamiento de datos, que incluye tareas como la limpieza del texto (eliminación de caracteres o formatos irrelevantes), la tokenización y, a veces, la normalización (conversión de palabras a una forma base). Tras el preprocesamiento, se extraen las características relevantes para la tarea. Estas características se introducen en modelos ML o DL para su análisis o generación.

La PNL moderna depende en gran medida de las Redes Neuronales (RN), en particular de arquitecturas sofisticadas como las Redes Neuronales Recurrentes (RNR) para datos secuenciales y, más recientemente, de los Transformadores. Los Transformadores, que se distinguen por sus potentes mecanismos de atención, han demostrado ser excepcionalmente eficaces para captar las dependencias de largo alcance y el contexto dentro del lenguaje. Esta arquitectura sustenta muchos modelos de vanguardia, incluidas variantes de BERT y modelos GPT como GPT-4. Plataformas de investigación como la Antología ACL albergan numerosos artículos que detallan estos avances.

Aplicaciones de la PNL

La PNL impulsa una amplia gama de aplicaciones que están transformando las industrias y mejorando las interacciones cotidianas. He aquí dos ejemplos destacados:

  1. Asistentes virtuales y chatbots: Sistemas como Siri de Apple y Alexa de Amazon, junto con innumerables chatbots de atención al cliente, utilizan ampliamente la PNL. Emplean el reconocimiento de voz para convertir las palabras habladas en texto, la Comprensión del Lenguaje Natural (NLU ) para captar la intención del usuario y, a veces, la generación de texto para formular respuestas.
  2. Filtrado de spam de correo electrónico: Las técnicas de PNL analizan el contenido del correo electrónico para identificar patrones característicos de spam o intentos de phishing. Los algoritmos clasifican los correos electrónicos basándose en palabras clave, reputación del remitente y estructura lingüística, ayudando a mantener las bandejas de entrada limpias y seguras.

Otras aplicaciones comunes son el resumen de textos para condensar documentos largos, los motores de búsqueda semántica que comprenden el significado de la consulta más allá de la simple coincidencia de palabras clave, y las herramientas de corrección gramatical/estilística como Grammarly. Muchos casos de uso innovadores de la IA dependen en gran medida de la PNL.

PNL vs. Conceptos relacionados

Aunque está relacionada, la PNL difiere de algunos términos similares:

  • Comprensión del Lenguaje Natural (NLU): La NLU es un subconjunto de la PNL centrado específicamente en el aspecto de la comprensión: extraer el significado, la intención y el contexto del lenguaje. La PNL es más amplia y también abarca tareas como la generación de texto y la síntesis de voz.
  • Generación de texto: Se trata de una capacidad o tarea específica dentro de la PNL que se centra en producir texto similar al humano. Aunque es una parte esencial de muchas aplicaciones de PNL (como los chatbots o la traducción), no cubre los aspectos de comprensión o análisis de la PNL.
  • Visión por ordenador (VC): La CV se ocupa de interpretar y comprender la información procedente de entradas visuales como imágenes y vídeos, centrándose en tareas como la detección de objetos o la segmentación de imágenes. La PNL, en cambio, se centra en los datos lingüísticos. Sin embargo, estos campos se entrecruzan cada vez más en modelos multimodales que procesan tanto texto como imágenes, permitiendo aplicaciones como el subtitulado automático de imágenes. Puedes leer más sobre el puente entre la PNL y la CV. Ultralytics se especializa en CV, ofreciendo modelos como Ultralytics YOLO11 para tareas que exigen gran precisión y velocidad.

Herramientas y plataformas

Desarrollar e implantar aplicaciones de PNL a menudo implica aprovechar bibliotecas y plataformas especializadas:

  • Bibliotecas: Las bibliotecas de código abierto como spaCy y NLTK proporcionan herramientas para tareas comunes de PNL como la tokenización, el análisis sintáctico y el reconocimiento de entidades.
  • Plataformas: Hugging Face ofrece un vasto repositorio de modelos preentrenados (especialmente Transformadores), conjuntos de datos y herramientas que aceleran significativamente el desarrollo. Para gestionar el ciclo de vida completo de los modelos ML, incluidos los utilizados en PNL o en canalizaciones CV-NLP combinadas, las plataformas como Ultralytics HUB ofrecen sólidas capacidades MLOps, que agilizan el entrenamiento, el despliegue y la supervisión. Explora la documentación de Ultralytics para obtener más recursos sobre el desarrollo y despliegue de modelos.
Leer todo