Sfrutta la potenza dell'apprendimento per trasferimento per risparmiare tempo, aumentare le prestazioni dell'intelligenza artificiale e affrontare nuovi compiti con dati limitati grazie a modelli pre-addestrati.
L'apprendimento per trasferimento è una tecnica di apprendimento automatico (ML) in cui un modello sviluppato per un compito specifico viene riutilizzato come punto di partenza per un modello su un secondo compito correlato. Invece di costruire un modello da zero, che richiede notevoli risorse di dati e di calcolo, l'apprendimento per trasferimento sfrutta la conoscenza (caratteristiche, modelli e pesi) appresa da un compito di partenza per migliorare l'apprendimento di un compito di arrivo. Questo approccio è particolarmente vantaggioso quando il compito di destinazione ha un numero limitato di dati etichettati, in quanto accelera significativamente il processo di formazione e spesso porta a prestazioni migliori rispetto alla formazione solo sul set di dati di destinazione.
L'idea alla base dell'apprendimento per trasferimento è che un modello addestrato su un set di dati ampio e generale, come ImageNet per i compiti di immagine o un corpus di testo massiccio per l'elaborazione del linguaggio naturale (NLP), impara caratteristiche generali che sono utili per molti altri compiti correlati. Ad esempio, nella computer vision (CV), gli strati iniziali di una rete neurale convoluzionale (CNN) potrebbero imparare a rilevare bordi, texture e forme semplici, elementi visivi fondamentali applicabili a diversi problemi di riconoscimento delle immagini.
Quando si applica l'apprendimento per trasferimento, in genere si parte da un modello pre-addestrato. A seconda della somiglianza tra i compiti di partenza e di arrivo e delle dimensioni del set di dati di arrivo, potresti:
L'apprendimento per trasferimento è ampiamente applicato in diversi ambiti:
Piattaforme come Ultralytics HUB semplificano il processo di applicazione dell'apprendimento per trasferimento fornendo modelli pre-addestrati (come Ultralytics YOLOv8 e YOLO11) e strumenti per una facile formazione personalizzata su set di dati specifici dell'utente. Framework come PyTorch e TensorFlow offrono anche un ampio supporto e tutorial per implementare i flussi di lavoro dell'apprendimento per trasferimento. Per una comprensione teorica più approfondita, risorse come la panoramica di Stanford CS231n sull'apprendimento per trasferimento o indagini accademiche come"A Survey on Deep Transfer Learning" offrono spunti preziosi.