Glosario

Procesamiento del Lenguaje Natural (PLN)

Descubre los conceptos, técnicas y aplicaciones del Procesamiento del Lenguaje Natural (PLN), como los chatbots, el análisis de sentimientos y la traducción automática.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Procesamiento del Lenguaje Natural (PLN) es un campo dinámico dentro de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM) dedicado a capacitar a los ordenadores para comprender, procesar, interpretar y generar lenguaje humano, tanto texto como voz. Combina la lingüística computacional con el modelado estadístico, el ML y los modelos de Aprendizaje Profundo (DL) para salvar la distancia entre la comunicación humana y la comprensión informática. El objetivo es permitir que las máquinas interactúen con el lenguaje de forma significativa y útil.

Conceptos clave de la PNL

La PNL implica varias tareas básicas que descomponen el lenguaje en componentes comprensibles para las máquinas:

  • Tokenización: El proceso de dividir el texto en unidades más pequeñas, como palabras o subpalabras (tokens).
  • Etiquetado de la parte del discurso (POS): Asignación de categorías gramaticales (sustantivo, verbo, adjetivo) a cada token.
  • Reconocimiento de Entidades Nombradas (REN): Identificar y categorizar entidades clave en el texto, como nombres de personas, organizaciones, lugares, fechas, etc.
  • Análisis de Sentimiento: Determinar el tono emocional (positivo, negativo, neutro) expresado en un texto.
  • Traducción automática: Traducción automática de texto o voz de un idioma a otro. Esto se ejemplifica con herramientas como Google Translate.
  • Modelado del lenguaje: Predicción de la probabilidad de una secuencia de palabras, fundamental para tareas como la generación de textos.

Cómo funciona la PNL

Los sistemas de PLN suelen seguir un enfoque de canalización. Los datos de texto sin procesar se someten a un preprocesamiento (como la tokenización y la limpieza) antes de extraer las características. A continuación, estas características se introducen en los modelos ML o DL. La PNL moderna depende en gran medida de las redes neuronales, especialmente de arquitecturas como las Redes Neuronales Recurrentes (RNN) y, más recientemente, los Transformadores. Los Transformadores, conocidos por sus mecanismos de atención, destacan en la captura del contexto en el lenguaje, impulsando modelos de vanguardia como el GPT-4. Plataformas de investigación como la Antología ACL albergan muchos artículos que detallan estos avances.

Aplicaciones de la PNL

La PNL impulsa una amplia gama de aplicaciones que transforman las industrias y las interacciones cotidianas:

  1. Asistentes virtuales y chatbots: Sistemas como Amazon Alexa, Google Assistant y los chatbots de atención al cliente utilizan la PNL para comprender las consultas de los usuarios y responder de forma natural. Emplean técnicas como el reconocimiento del habla y la Comprensión del Lenguaje Natural (NLU).
  2. Análisis de Sentimiento para la Investigación de Mercado: Las empresas analizan las publicaciones en las redes sociales, las opiniones de los clientes y las respuestas a las encuestas utilizando el análisis de sentimientos para calibrar la opinión pública sobre los productos o las marcas, lo que ayuda a informar las estrategias empresariales. Explora los casos de uso de la IA para ver más ejemplos.

Otras aplicaciones comunes son el filtrado de correo basura, el resumen de textos, los motores de búsqueda semántica y las herramientas de corrección gramatical como Grammarly.

PNL vs. Conceptos relacionados

Aunque está relacionada, la PNL difiere de términos similares:

  • Comprensión del Lenguaje Natural (NLU): Un subcampo de la PNL centrado específicamente en la comprensión de lectura automática: entender el significado que hay detrás del texto. La PNL es más amplia y abarca también la generación y otras tareas.
  • Generación de texto: Una aplicación específica dentro de la PNL centrada en producir textos similares a los humanos.
  • Visión por ordenador (VC): Se ocupa de interpretar la información visual de imágenes o vídeos. Aunque son distintas, la PNL y la VC se combinan a menudo en modelos multimodales para tareas como el subtitulado de imágenes o la respuesta a preguntas visuales. Más información sobre el puente entre la PNL y la CV. Los modelosYOLO Ultralytics , principalmente para tareas de CV como la detección de objetos, pueden integrarse en sistemas que también aprovechan la PNL.

Herramientas y plataformas

El desarrollo de aplicaciones de PNL suele implicar el uso de bibliotecas y marcos como spaCy o NLTK, y plataformas como Hugging Face que proporcionan acceso a numerosos modelos y conjuntos de datos preentrenados. Para desplegar y gestionar modelos, incluidos los utilizados en PNL o en canalizaciones CV-NLP combinadas, plataformas como Ultralytics HUB ofrecen sólidas capacidades MLOps.

Leer todo