Glosario

Modelado lingüístico

Descubre cómo el modelado del lenguaje potencia las aplicaciones de PNL e IA como la generación de texto, la traducción automática y el reconocimiento de voz con técnicas avanzadas.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El modelado del lenguaje es una tarea fundamental dentro del Procesamiento del Lenguaje Natural (PLN) y la Inteligencia Artificial (IA) centrada en predecir la probabilidad de que se produzca una secuencia de palabras en un idioma determinado. Esencialmente, consiste en construir modelos que comprendan los patrones estadísticos y las estructuras gramaticales del lenguaje humano, permitiendo a las máquinas procesar, comprender y generar texto que se parezca a la comunicación humana. Estos modelos aprenden de grandes cantidades de datos de texto para captar las relaciones entre las palabras y sus patrones de uso típicos.

Cómo funciona el modelado lingüístico

En esencia, un modelo lingüístico asigna una probabilidad a una secuencia de palabras. Los primeros enfoques se basaban en métodos estadísticos como los n-gramas, que calculan la probabilidad de una palabra basándose en las "n-1" palabras precedentes. Aunque sencillos, estos modelos tienen dificultades para captar las dependencias de largo alcance en el texto. El modelado lingüístico moderno utiliza en gran medida las Redes Neuronales (RN), en particular arquitecturas como las Redes Neuronales Recurrentes (RNR) y, más recientemente, los Transformadores. Los Transformadores, presentados en el artículo "La atención es todo lo que necesitas", utilizan mecanismos como la autoatención para ponderar la importancia de las distintas palabras de una secuencia, independientemente de su distancia, lo que permite comprender mucho mejor el contexto. Entrenar estos modelos implica procesar grandes corpus textuales, descomponer el texto mediante la tokenización y aprender representaciones(embeddings) para estos tokens.

Relevancia y aplicaciones

El modelado del lenguaje es una tecnología fundamental que impulsa muchas aplicaciones de IA que interactúan con el lenguaje humano. Su capacidad para predecir y comprender secuencias de palabras le confiere un valor incalculable en diversos ámbitos.

Las aplicaciones en el mundo real incluyen:

Conceptos relacionados

Comprender el modelado lingüístico implica familiarizarse con los términos relacionados:

  • Procesamiento del Lenguaje Natural (PLN): El modelado del lenguaje es un subcampo del dominio más amplio de la PLN, que abarca diversas tareas como el Reconocimiento de Entidades Nombradas (REN), el etiquetado de partes del discurso y la respuesta a preguntas. Muchas tareas de la PNL utilizan modelos lingüísticos.
  • Grandes modelos lingüísticos (LLM): Son modelos lingüísticos muy avanzados, como el GPT-4, que se caracterizan por su enorme tamaño (miles de millones de parámetros) y su entrenamiento en enormes conjuntos de datos(Big Data). Los LLM muestran capacidades notables para comprender y generar texto similar al humano en tareas complejas. Muchos LLM preentrenados están disponibles en plataformas como Hugging Face.
  • Generación de textos: Aunque está estrechamente relacionada, la generación de texto es una aplicación del modelado del lenguaje. El modelo lingüístico proporciona las probabilidades de las secuencias de palabras, y el proceso de generación utiliza estas probabilidades (a menudo con estrategias de muestreo) para producir un nuevo texto.
  • Modelos multimodales: Estos modelos integran la comprensión del lenguaje con otros tipos de datos, como las imágenes en Visión por Computador (VC). Modelos como CLIP aprenden representaciones conjuntas de texto e imágenes, lo que permite realizar tareas como el subtitulado de imágenes o la respuesta a preguntas visuales. Explora Ultralytics HUB para obtener herramientas de gestión y despliegue de diversos modelos de IA, incluidos los que potencialmente integran capacidades lingüísticas.
Leer todo