Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Modelo fundacional

Explora el poder de los modelos básicos en la IA. Aprende a adaptar modelos a gran escala como Ultralytics para tareas personalizadas utilizando la Ultralytics .

Un modelo base representa un cambio de paradigma significativo en el campo de la inteligencia artificial (IA). Se trata de un modelo de aprendizaje automático a gran escala entrenado con una gran cantidad de datos, que a menudo abarca miles de millones de parámetros, y que puede adaptarse a una amplia gama de tareas posteriores. A diferencia de los modelos tradicionales de aprendizaje automático (ML), que normalmente se crean con un propósito específico y singular, como clasificar un tipo concreto de flor, un modelo básico aprende patrones, estructuras y relaciones amplias durante una fase de preentrenamiento que requiere muchos recursos. Esta amplia base de conocimientos permite a los desarrolladores aplicar el modelo a nuevos problemas mediante el aprendizaje por transferencia, lo que reduce significativamente el tiempo y los datos necesarios para lograr resultados de vanguardia.

Mecanismos básicos: Preentrenamiento y adaptación

El poder de un modelo base reside en su proceso de desarrollo en dos etapas: preentrenamiento y ajuste. Durante el preentrenamiento, el modelo se expone a conjuntos de datos masivos, como grandes porciones de Internet, diversas bibliotecas de imágenes o extensos repositorios de código. Esta etapa suele utilizar el aprendizaje auto-supervisado, una técnica en la que el modelo genera sus propias etiquetas a partir de la propia estructura de datos, eliminando el cuello de botella de la anotación manual de datos. Por ejemplo, un modelo de lenguaje puede aprender a predecir la siguiente palabra de una frase, mientras que un modelo de visión aprende a entender los bordes, las texturas y la permanencia de los objetos.

Una vez preentrenado, el modelo actúa como un punto de partida versátil. A través de un proceso denominado ajuste fino, los desarrolladores pueden modificar los pesos del modelo en un conjunto de datos más pequeño y específico del dominio. Esta capacidad es fundamental para la democratización de la IA, ya que permite a las organizaciones con recursos computacionales limitados aprovechar arquitecturas potentes. Los flujos de trabajo modernos suelen utilizar herramientas como la Ultralytics para agilizar este proceso de adaptación, lo que permite un entrenamiento eficiente en conjuntos de datos personalizados sin necesidad de construir una red neuronal desde cero.

Aplicaciones en el mundo real

Los modelos de foundation sirven como columna vertebral para las innovaciones en diversas industrias. Su capacidad de generalización los hace aplicables a tareas que van desde el procesamiento del lenguaje natural hasta la visión artificial avanzada.

  • Visión artificial en el ámbito sanitario: los modelos básicos de visión especializada pueden ajustarse para ayudar en el análisis de imágenes médicas. Un modelo entrenado originalmente con imágenes generales puede adaptarse para detect en resonancias magnéticas o identificar fracturas en radiografías. Esta aplicación demuestra cómo la comprensión visual general se traduce en herramientas de diagnóstico que salvan vidas .
  • Automatización industrial: En la fabricación, los modelos de visión como Ultralytics funcionan como arquitecturas fundamentales para la detección de objetos. Las fábricas utilizan estos modelos para automatizar la inspección de calidad, detectando defectos en las líneas de montaje con gran velocidad y precisión. El conocimiento preexistente del modelo sobre los límites de los objetos acelera la implementación de estas soluciones de fabricación inteligente.

Ejemplo de implementación técnica

Los desarrolladores pueden aprovechar los modelos básicos para realizar tareas complejas con un mínimo de código. El siguiente ejemplo muestra cómo cargar un modelo YOLO26preentrenado, un modelo básico de visión optimizado para aplicaciones en tiempo real, y realizar la detección de objetos en una imagen.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Diferenciación de términos clave

Es útil distinguir el «modelo base» de conceptos relacionados en el panorama de la IA para comprender sus funciones específicas:

  • Modelo de lenguaje grande (LLM): Un LLM es un tipo de modelo base diseñado específicamente para procesar y generar texto. Si bien todos los LLM son modelos base, no todos los modelos base son LLM; la categoría también incluye modelos de visión como SAM Segment Anything Model) y sistemas multimodales.
  • Aprendizaje por transferencia: es la técnica utilizada para aplicar un modelo base a una nueva tarea. El modelo base es el artefacto (la red neuronal guardada ), mientras que el aprendizaje por transferencia es el proceso de actualización del conocimiento de ese artefacto para un caso de uso específico , como el control de plagas en la agricultura.
  • IA generativa: se refiere a sistemas que pueden crear contenido nuevo (texto, imágenes, código). Muchos modelos fundamentales impulsan aplicaciones de IA generativa, pero también pueden utilizarse para tareas discriminativas como la clasificación o el seguimiento de objetos, que no son estrictamente «generativas».

Orientaciones futuras e impacto

La evolución de los modelos básicos avanza hacia la IA multimodal, en la que un único sistema puede procesar y relacionar simultáneamente información procedente de texto, imágenes, audio y datos de sensores. Las investigaciones de instituciones como el Instituto de Stanford para la IA Centrada en el Ser Humano (HAI) destacan el potencial de estos sistemas para razonar sobre el mundo de una manera más parecida a la de los humanos. A medida que estos modelos se vuelven más eficientes, su implementación en dispositivos de computación periférica se hace cada vez más factible, lo que aporta potentes capacidades de IA directamente a los teléfonos inteligentes, los drones y los sensores del IoT.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora