Glosario

Ajuste rápido

Descubre cómo el ajuste rápido mejora la eficacia de la IA optimizando modelos preentrenados para tareas específicas con recursos mínimos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El ajuste de instrucciones es una técnica utilizada para adaptar y optimizar modelos preentrenados para tareas específicas, ajustando sólo un pequeño conjunto de parámetros, a menudo asociados con instrucciones específicas de la tarea. Este enfoque reduce los costes computacionales y los requisitos de almacenamiento en comparación con los métodos tradicionales de ajuste fino, en los que se vuelve a entrenar todo el modelo. El ajuste de instrucciones es especialmente eficaz en ámbitos como el Procesamiento del Lenguaje Natural (PLN) y la Visión por Ordenador (VC), ya que permite a los usuarios aprovechar la potencia de grandes modelos preentrenados para diversas aplicaciones.

Cómo funciona el ajuste rápido

El ajuste de las instrucciones modifica las instrucciones de entrada o las incrustaciones introducidas en un modelo preentrenado, en lugar de alterar la arquitectura central o los pesos del modelo. Añadiendo información o parámetros específicos de la tarea a los datos de entrada, se puede guiar al modelo para que adapte sus predicciones a una nueva tarea. Este método es especialmente útil cuando se trabaja con modelos a gran escala como GPT-4 o Transformadores de Visión (ViT), en los que volver a entrenar toda la red sería costoso desde el punto de vista informático.

Ejemplo: Ajuste fino frente a ajuste rápido

  • Ajuste fino: Ajusta todos los pesos del modelo para una tarea específica, lo que requiere importantes recursos informáticos y almacenamiento.
  • Ajuste de avisos: Optimiza las indicaciones o incrustaciones específicas de la tarea, dejando el modelo principal sin cambios, lo que es mucho más eficiente.

Para profundizar en las técnicas relacionadas, explora el Ajuste fino eficiente de parámetros (PEFT), que comparte similitudes con el ajuste rápido pero incluye estrategias más amplias como los adaptadores y las adaptaciones de bajo rango.

Ventajas del ajuste rápido

  • Eficacia: Requiere menos recursos en comparación con el ajuste completo del modelo.
  • Escalabilidad: Permite utilizar modelos preentrenados para múltiples tareas nuevas sin duplicar todo el modelo.
  • Flexibilidad: Se integra fácilmente con modelos multimodales, como los que combinan datos de texto e imagen (por ejemplo, CLIP).
  • Sobreajuste reducido: Limita el riesgo de sobreajuste ajustando sólo un pequeño subconjunto de parámetros.

Aplicaciones en el mundo real

El ajuste rápido se ha aplicado con éxito en diversos sectores para resolver retos específicos de cada dominio. A continuación, dos ejemplos notables:

1. Análisis de Sentimiento en las Opiniones de los Clientes

Afinando los grandes modelos lingüísticos como GPT con indicaciones específicas para cada tarea, las empresas pueden analizar el sentimiento de los clientes a partir de las opiniones o las publicaciones en las redes sociales. Por ejemplo, se puede pedir a un modelo que clasifique las opiniones como positivas, neutras o negativas, mejorando así los flujos de trabajo del servicio de atención al cliente.

2. Segmentación de imágenes en sanidad

En el tratamiento de imágenes médicas, el ajuste de las indicaciones puede ayudar a adaptar modelos preentrenados como el Segment Anything Model (SAM ) a tareas específicas como la detección de tumores o la segmentación de órganos. Con sólo personalizar las indicaciones específicas de la tarea, los profesionales sanitarios pueden obtener resultados precisos sin necesidad de volver a entrenar todo el modelo.

Sintonización del indicador frente a conceptos relacionados

Aunque la sintonización rápida comparte similitudes con otros métodos como la sintonización fina y el aprendizaje cero, ofrece ventajas únicas:

  • Ajuste fino: Requiere más recursos y modifica todo el modelo.
  • Aprendizaje de disparo cero: Utiliza modelos preentrenados sin adaptación, mientras que el ajuste rápido proporciona un término medio al permitir una adaptación mínima pero eficaz.
  • Ingeniería de avisos: Se centra en el diseño de avisos textuales o de entrada, mientras que el ajuste de avisos implica la optimización de incrustaciones o parámetros específicos para las tareas.

Herramientas y marcos

Varios marcos admiten el ajuste rápido para tareas de PNL y CV, lo que lo hace accesible a investigadores y desarrolladores:

  • Hugging Face: Ofrece herramientas para integrar el ajuste rápido con modelos basados en transformadores.
  • Ultralytics HUB: Simplifica el entrenamiento y despliegue de modelos, con soporte para adaptar modelos preentrenados como Ultralytics YOLO para nuevas tareas.
  • API OpenAI: Permite la optimización rápida de los modelos lingüísticos más avanzados, como el GPT-4.

Orientaciones futuras

La sintonización de estímulos está llamada a aumentar su relevancia a medida que los modelos se hacen más grandes y complejos. Con el auge del aprendizaje multimodal y los modelos de base, la sintonización de estímulos ofrece una solución escalable para la adaptación a tareas específicas. También está en consonancia con el cambio de la industria hacia una IA más accesible y eficiente, sobre todo para las aplicaciones del mundo real en áreas como la sanidad y la fabricación.

Para profundizar en conceptos y aplicaciones relacionados, visita el Glosario de IA y Visión por Computador.

Leer todo