Glosario

Procesamiento del lenguaje natural (PLN)

Descubra conceptos, técnicas y aplicaciones de Procesamiento del Lenguaje Natural (PLN) como chatbots, análisis de sentimientos y traducción automática.

El Procesamiento del Lenguaje Natural (PLN) es un campo dinámico de la inteligencia artificial (IA) y el aprendizaje automático (AM) dedicado a capacitar a los ordenadores para comprender, interpretar, generar e interactuar con el lenguaje humano de forma valiosa. El objetivo último del PLN es salvar la brecha de comunicación entre humanos y máquinas, permitiendo que los programas informáticos procesen y analicen datos de texto y voz a una escala y velocidad superiores a la capacidad humana. Para ello hay que desarrollar algoritmos y modelos capaces de manejar la complejidad, los matices y el contexto inherentes al lenguaje natural.

¿Cómo funciona la PNL?

Los sistemas de PLN utilizan la lingüística computacional -modelo del lenguaje humano basado en reglas- junto con modelos estadísticos y de aprendizaje profundo para procesar los datos lingüísticos. El proceso suele comenzar con el preprocesamiento de datos, en el que el texto en bruto se divide en unidades más pequeñas y manejables mediante un proceso denominado tokenización.

Una vez tokenizados, los procesos modernos de PLN utilizan arquitecturas avanzadas de redes neuronales, como las redes neuronales recurrentes (RNN ) y, más recientemente, la influyente arquitectura Transformer. Estos modelos, que constituyen la base de los actuales modelos lingüísticos amplios (LLM), analizan las relaciones contextuales entre las palabras. Esto les permite realizar tareas complejas como reconocer intenciones, traducir idiomas e incluso crear contenidos originales. Instituciones punteras como el Stanford NLP Group y organizaciones como la Association for Computational Linguistics (ACL) están a la vanguardia de esta investigación.

Aplicaciones reales

La PNL impulsa una amplia gama de aplicaciones que muchos de nosotros utilizamos a diario. Dos ejemplos destacados son:

  1. Traducción automática: Herramientas como Google Translate utilizan sofisticados modelos de PNL para traducir automáticamente texto y voz de un idioma a otro. Estos sistemas analizan la estructura y el significado de las frases en la lengua de partida y generan una traducción gramaticalmente correcta y contextualmente apropiada en la lengua de llegada. Estos modelos se entrenan con enormes conjuntos de datos de textos paralelos procedentes de fuentes como las actas de las Naciones Unidas.

  2. Análisis de sentimientos: Las empresas utilizan la PNL para analizar los comentarios de los clientes en las redes sociales, las reseñas de productos y las encuestas. Al clasificar el tono emocional del texto como positivo, negativo o neutro, las empresas pueden obtener información sobre la opinión pública, la satisfacción del cliente y la percepción de la marca, lo que permite tomar decisiones basadas en datos.

Otras aplicaciones comunes son los asistentes virtuales inteligentes como Siri y Alexa, los filtros de correo electrónico no deseado, las herramientas de resumen de texto y los chatbots para atención al cliente.

PNL frente a conceptos afines

Aunque está relacionada, la PNL difiere de algunos términos similares:

  • Comprensión del Lenguaje Natural (NLU): El NLU es un subconjunto de la PNL centrado específicamente en el aspecto de la comprensión: extraer el significado, la intención y el contexto del lenguaje. La PNL es más amplia y también abarca tareas como la generación de textos y la síntesis de voz.
  • Generación de texto: Se trata de una capacidad o tarea específica dentro de la PNL que se centra en la producción de texto similar al humano. Aunque es una parte esencial de muchas aplicaciones de PNL (como los chatbots o la traducción), no cubre los aspectos de comprensión o análisis de la PNL.
  • Visión por ordenador (CV): La CV se ocupa de interpretar y comprender la información procedente de entradas visuales como imágenes y vídeos, centrándose en tareas como la detección de objetos o la segmentación de imágenes. La PNL, en cambio, se centra en los datos lingüísticos. Sin embargo, ambos campos se entrecruzan cada vez más en modelos multimodales que procesan tanto texto como imágenes y permiten aplicaciones como el subtitulado automático de imágenes. Más información sobre el puente entre PNL y CV. Ultralytics se especializa en CV y ofrece modelos como Ultralytics YOLO11 para tareas que exigen gran precisión y velocidad.

Herramientas y plataformas

El desarrollo y la implantación de aplicaciones de PNL suelen implicar el uso de bibliotecas y plataformas especializadas:

  • Bibliotecas: Bibliotecas de código abierto como spaCy y NLTK ofrecen herramientas para tareas comunes de PLN como la tokenización, el análisis sintáctico y el reconocimiento de entidades.
  • Plataformas: Hugging Face ofrece un amplio repositorio de modelos preentrenados (especialmente Transformers), conjuntos de datos y herramientas que aceleran significativamente el desarrollo. Para gestionar el ciclo de vida completo de los modelos de ML, incluidos los utilizados en NLP o en canalizaciones combinadas de CV-NLP, plataformas como Ultralytics HUB ofrecen sólidas funciones de MLOps, que agilizan la formación, el despliegue y la supervisión. Explore la documentación de Ultralytics para obtener más recursos sobre desarrollo y despliegue de modelos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles