Glosario

Ajuste fino eficiente de parámetros (PEFT)

Descubre el Ajuste Fino Eficaz de Parámetros (PEFT): adapta grandes modelos de IA de forma eficaz con recursos mínimos. Optimiza tareas de PNL, visión y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Ajuste Fino Eficaz de Parámetros (PEFT) es un enfoque de aprendizaje automático diseñado para adaptar grandes modelos preentrenados a nuevas tareas con una sobrecarga computacional mínima. Al ajustar sólo un pequeño subconjunto de parámetros, las técnicas PEFT hacen que el proceso de ajuste sea más eficaz, reduciendo las necesidades de recursos y conservando el conocimiento general codificado en el modelo preentrenado.

Importancia del PEFT

El ajuste fino tradicional implica actualizar todos los parámetros de un modelo, lo que puede ser costoso desde el punto de vista informático y consumir mucha memoria, especialmente para modelos grandes como las arquitecturas basadas en transformadores. PEFT aborda este problema modificando sólo una fracción de los parámetros y manteniendo sin cambios la mayor parte del modelo preentrenado. Este enfoque es especialmente beneficioso cuando los recursos informáticos son limitados o cuando se trata de múltiples tareas que requieren personalización sin tener que volver a entrenar todo el modelo cada vez.

Las técnicas PEFT se alinean con la creciente demanda de soluciones eficientes en recursos en la IA, permitiendo la aplicación práctica de grandes modelos en diversas industrias, como la sanidad, la agricultura y el comercio minorista.

Técnicas clave en PEFT

Se han desarrollado varios enfoques para un ajuste fino eficiente de los parámetros:

  • Adaptación de Bajo Rango (LoRA): LoRA inyecta actualizaciones de bajo rango específicas de la tarea en el modelo, optimizando sólo estos parámetros adicionales para adaptarse a las nuevas tareas.
  • Capas adaptadoras: Son pequeños módulos de red neuronal insertados en la arquitectura del modelo, normalmente entre capas, para aprender ajustes específicos de la tarea.
  • Ajuste de las instrucciones: Este método consiste en ajustar sólo las indicaciones de entrada que se introducen en el modelo, sin cambiar los parámetros del modelo. Más información sobre el ajuste de preguntas.
  • Sintonización de prefijos: Similar a la sintonización rápida, la sintonización prefija optimiza una secuencia de parámetros específicos de la tarea que actúan como prefijo de los datos de entrada.

Cada método pretende reducir el tiempo de entrenamiento y el uso de recursos, manteniendo al mismo tiempo un gran rendimiento en las tareas posteriores.

Aplicaciones del PEFT

La PEFT ha encontrado aplicaciones en una amplia gama de dominios de IA y aprendizaje automático, en particular cuando las limitaciones de recursos o la diversidad de tareas son consideraciones clave.

Ejemplo 1: Procesamiento del Lenguaje Natural (PLN)

En la PLN, las técnicas PEFT se utilizan ampliamente para adaptar grandes modelos lingüísticos como GPT-3 o GPT-4 a tareas específicas, como el análisis de sentimientos, el resumen o la respuesta a preguntas específicas de un dominio. Por ejemplo, el LoRA puede aplicarse para afinar el GPT-3 para el análisis de textos médicos, permitiendo predicciones precisas al tiempo que se minimizan las necesidades computacionales.

Ejemplo 2: IA de visión

En visión por ordenador, PEFT se utiliza para afinar modelos preentrenados como Ultralytics YOLO para tareas específicas, como detectar objetos raros en conjuntos de datos especializados. Al ajustar sólo una pequeña parte de los pesos del modelo, las organizaciones pueden desplegar rápidamente soluciones a medida para tareas como la vigilancia de la fauna salvaje o el control de calidad industrial sin necesidad de un reentrenamiento exhaustivo.

Ventajas del PEFT

  1. Eficiencia de recursos: Reduce los requisitos computacionales y de memoria, haciéndolo accesible para su despliegue en dispositivos periféricos o en entornos con recursos limitados.
  2. Flexibilidad de tareas: Facilita la adaptación rápida a múltiples tareas posteriores sin necesidad de volver a entrenar todo el modelo, lo que resulta especialmente útil para sectores como la sanidad y la fabricación.
  3. Rentabilidad: Reduce el coste del ajuste fino de grandes modelos al centrarse en un pequeño subconjunto de parámetros.
  4. Conservación del Conocimiento General: Conserva las capacidades de propósito general del modelo preentrenado al tiempo que añade conocimientos específicos de la tarea.

Diferencias con el ajuste fino tradicional

En el ajuste fino tradicional, se actualiza todo el modelo, lo que puede resultar caro desde el punto de vista informático y propenso al sobreajuste, especialmente con conjuntos de datos pequeños. PEFT, en cambio, se centra en optimizar un número mínimo de parámetros, consiguiendo resultados comparables con una sobrecarga computacional significativamente reducida.

PEFT también difiere del Aprendizaje por Transferencia, en el que un modelo preentrenado se adapta a una nueva tarea reentrenando algunas o todas las capas. Mientras que el aprendizaje por transferencia puede implicar un reentrenamiento completo del modelo, el PEFT está diseñado explícitamente para minimizar las actualizaciones de los parámetros.

Repercusiones en el mundo real

La adopción de PEFT ha permitido la proliferación de soluciones de IA en entornos con recursos limitados. Por ejemplo, en la agricultura, PEFT puede afinar los modelos de visión para detectar con precisión las enfermedades de los cultivos mientras funciona en dispositivos de baja potencia. Del mismo modo, en sanidad, PEFT facilita la adaptación de modelos para tareas como la detección de tumores utilizando conjuntos de datos especializados, como se destaca en las soluciones sanitarias deUltralytics .

PEFT también está integrado en herramientas como Ultralytics HUB, que simplifica el entrenamiento y el despliegue de modelos personalizados, garantizando que los usuarios puedan adaptar eficazmente los modelos preentrenados a sus necesidades únicas.

Conclusión

El Ajuste Fino Eficaz de Parámetros (PEFT) representa un importante paso adelante para hacer que la IA sea más accesible y adaptable. Al permitir la adaptación eficiente de grandes modelos a nuevas tareas, el PEFT permite a las industrias aprovechar todo el potencial de la IA, reduciendo al mismo tiempo los costes y las demandas computacionales. Con aplicaciones que abarcan la PNL, la visión por ordenador y más allá, PEFT sigue desempeñando un papel fundamental en el avance de las tecnologías de IA.

Leer todo