Desbloquea el poder del aprendizaje por transferencia para ahorrar tiempo, aumentar el rendimiento de la IA y abordar nuevas tareas con datos limitados utilizando modelos preentrenados.
El aprendizaje por transferencia es una técnica de Aprendizaje Automático (AM ) en la que un modelo desarrollado para una tarea se reutiliza como punto de partida para un modelo sobre una segunda tarea relacionada. En lugar de construir un modelo desde cero, el aprendizaje por transferencia aprovecha los conocimientos (características, pesos) aprendidos de una tarea de origen, reduciendo significativamente el tiempo de entrenamiento, los requisitos de datos y los recursos informáticos necesarios para la tarea de destino. Este enfoque es especialmente beneficioso cuando la tarea de destino tiene pocos datos etiquetados.
El proceso suele comenzar con un modelo preentrenado en un gran conjunto de datos generales, como ImageNet para tareas de imagen o grandes corpus de texto para el Procesamiento del Lenguaje Natural (PLN). Este preentrenamiento permite al modelo, a menudo un modelo de Aprendizaje Profundo (Deep Learning, DL) como una Red Neuronal Convolucional (Convolutional Neural Network, CNN) o un Transformador, aprender características generales: bordes, texturas, patrones en imágenes, o gramática y semántica en texto.
Para la nueva tarea objetivo, se adapta este modelo preentrenado. Entre las estrategias habituales se incluyen:
Emplear el aprendizaje por transferencia ofrece varias ventajas clave:
El aprendizaje por transferencia se aplica ampliamente en diversos ámbitos:
Plataformas como Ultralytics HUB simplifican el proceso de aplicación del aprendizaje por transferencia proporcionando modelos preentrenados (YOLOv8, YOLOv11) y herramientas para facilitar el entrenamiento personalizado en conjuntos de datos específicos del usuario. Marcos como PyTorch y TensorFlow también ofrecen un amplio soporte y tutoriales para el aprendizaje por transferencia. Para una inmersión más profunda, explora recursos como la visión general de Stanford CS231n o encuestas académicas como"A Survey on Deep Transfer Learning".