Glosario

Gran modelo lingüístico (LLM)

Descubra cómo los grandes modelos lingüísticos (LLM) revolucionan la IA con PNL avanzada, potenciando los chatbots, la creación de contenidos y mucho más. Aprenda los conceptos clave.

Un Gran Modelo Lingüístico (LLM) es un tipo de modelo de Inteligencia Artificial (IA) diseñado para comprender, generar e interactuar con el lenguaje humano. Estos modelos son "grandes" porque contienen miles de millones de parámetros y se entrenan con grandes cantidades de datos de texto, que a menudo abarcan una parte significativa de la Internet pública, libros y otras fuentes. Este amplio entrenamiento les permite reconocer patrones complejos, gramática, contexto y matices del lenguaje, lo que los convierte en potentes herramientas para una amplia gama de tareas de Procesamiento del Lenguaje Natural (PLN ).

La arquitectura fundamental de la mayoría de los LLM modernos es el Transformer, introducido en el influyente artículo"Attention Is All You Need". Esta arquitectura permite al modelo sopesar la importancia de las distintas palabras (o tokens) en una secuencia, capturando las dependencias de largo alcance y las relaciones contextuales de forma mucho más eficaz que los diseños anteriores, como las redes neuronales recurrentes (RNN).

Cómo se utilizan los LLM

Los LLM se han integrado en innumerables aplicaciones de diversos sectores, cambiando radicalmente nuestra forma de interactuar con la tecnología. Su capacidad para generar textos coherentes y contextualmente relevantes les confiere una gran versatilidad.

Dos ejemplos destacados del mundo real son:

Chatbots avanzados y asistentes virtuales: Las empresas utilizan los LLM para crear sofisticados chatbots de atención al cliente capaces de comprender la intención del usuario y ofrecer respuestas detalladas y conversacionales. Asistentes digitales como Google Assistant y Alexa de Amazon aprovechan la tecnología LLM para lograr interacciones más naturales.
Creación y resumen de contenidos: Los LLM se utilizan mucho para redactar correos electrónicos, escribir artículos, generar textos creativos y crear textos de marketing. También pueden resumir textos, condensando documentos largos en resúmenes concisos, lo que resulta muy valioso en campos como el derecho y la investigación.

LLM frente a otros modelos de IA

Es importante diferenciar los LLM de otros tipos de modelos de IA, en particular los utilizados en distintos ámbitos como la visión por ordenador.

Modelado del lenguaje vs. LLM: El modelado del lenguaje es la tarea principal de predecir la siguiente palabra de una secuencia. Un LLM es una implementación a gran escala de un modelo de lenguaje, como el GPT-4 de OpenAI o los modelos Llama de Meta.
Modelos de fundamentos frente a LLM: Los LLM son una categoría destacada de los modelos de fundamentos. El término "modelo de base", popularizado por el Centro de Investigación sobre Modelos de Base (CRFM) de Stanford, es más amplio y engloba grandes modelos entrenados en varios tipos de datos, no sólo texto.
Modelos de visión por ordenador frente a LLM: se trata de una distinción clave. Mientras que los LLM procesan y generan texto, los modelos de visión por ordenador como Ultralytics YOLO11 están especializados en interpretar datos visuales de imágenes y vídeos. Los modelos de CV realizan tareas como la detección de objetos, la clasificación de imágenes y la segmentación de instancias. Plataformas como Ultralytics HUB están diseñadas para agilizar el ciclo de vida de los modelos de visión, desde la gestión del conjunto de datos hasta su despliegue.

El futuro: Integración multimodal

La línea que separa la Inteligencia Artificial del lenguaje y la visión se está difuminando con el desarrollo de los modelos multimodales. Estos modelos avanzados, a menudo denominados modelos de lenguaje visual (VLM), pueden procesar e integrar información procedente de múltiples modalidades, como texto e imágenes. Por ejemplo, un usuario podría subir una foto de una comida y pedir al modelo la receta. Esta convergencia, explorada en modelos como GPT-4o, es un paso importante hacia sistemas de IA más completos.

A pesar de su potencia, es crucial ser consciente de las limitaciones de los LLM, como la posibilidad de que generen información incorrecta(alucinaciones) y hereden sesgos de sus datos de entrenamiento. Estos retos ponen de manifiesto la importancia de la ética de la IA y de las prácticas de desarrollo responsables. Para obtener más información sobre la creación de aplicaciones de IA, puede consultar la documentación de Ultralytics.

Gran modelo lingüístico (LLM)

Solución flexible de licencias empresariales para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

Entrene modelos YOLO de forma sencilla con Ultralytics HUB

Cómo se utilizan los LLM

LLM frente a otros modelos de IA

El futuro: Integración multimodal

Leer más en esta categoría

Comprender la fabricación aditiva: Tecnología y casos de uso

Supervisión de las operaciones aeroportuarias en tierra con Ultralytics YOLO11

Evolución y futuro de la robótica en la fabricación

Únase a la comunidad Ultralytics