Esplora l'apprendimento supervisionato nell'IA. Scopri come modelli come Ultralytics utilizzano dati etichettati per la classificazione e la regressione al fine di ottenere risultati altamente accurati.
L'apprendimento supervisionato è un approccio fondamentale nell' intelligenza artificiale (AI) in cui gli algoritmi vengono addestrati su dati di input che sono stati contrassegnati con l'output corretto. In questo metodo, il modello apprende confrontando le proprie previsioni con queste etichette fornite, avendo essenzialmente un "supervisore" che lo corregge durante il processo di addestramento. L'obiettivo principale è che il sistema apprenda la funzione di mappatura dagli input agli output in modo sufficientemente accurato da poter prevedere con precisione le etichette per nuovi dati di test non ancora visti . Questa tecnica è la forza trainante di molte delle applicazioni di IA più pratiche e di successo attualmente in uso, che vanno dai filtri antispam delle e-mail ai sistemi di guida autonoma .
Il flusso di lavoro dell'apprendimento supervisionato ruota attorno all'uso di dati etichettati. Viene curato un set di dati in cui ogni esempio di addestramento è abbinato a un'etichetta "ground truth" corrispondente. Durante la fase di addestramento del modello, l'algoritmo elabora le caratteristiche di input e genera una previsione. Una formula matematica chiamata funzione di perdita misura quindi l'errore, ovvero la differenza tra la previsione del modello e l'etichetta effettiva.
Per ridurre al minimo questo errore, un algoritmo di ottimizzazione, come lo Stochastic Gradient Descent (SGD), regola iterativamente i parametri interni del modello o i pesi del modello. Questo processo si ripete per molti cicli, noti come epoche, fino a quando il modello raggiunge un livello soddisfacente di accuratezza senza sovradattamento ai dati di addestramento . Strumenti come la Ultralytics semplificano l'intera pipeline gestendo l'annotazione, l'addestramento e la valutazione dei set di dati in un ambiente unificato.
I problemi di apprendimento supervisionato sono generalmente classificati in due tipi principali in base alla natura della variabile target:
L'apprendimento supervisionato alimenta una vasta gamma di tecnologie in diversi settori industriali:
È importante distinguere l'apprendimento supervisionato dall'apprendimento non supervisionato. Mentre l'apprendimento supervisionato si basa su coppie input-output etichettate, l'apprendimento non supervisionato funziona con dati non etichettati. Negli scenari non supervisionati , l'algoritmo cerca di trovare autonomamente strutture, modelli o raggruppamenti nascosti all'interno dei dati, come la segmentazione dei clienti nel marketing. L'apprendimento supervisionato è generalmente più accurato per compiti specifici in cui sono disponibili dati storici , mentre l'apprendimento non supervisionato è migliore per l'analisi esplorativa dei dati.
L'apprendimento supervisionato è fondamentale per l'addestramento dei moderni modelli di visione artificiale. Il seguente Python mostra come addestrare un modello YOLO26 utilizzando un set di dati supervisionato (COCO8). Il modello apprende dalle immagini etichettate nel set di dati per detect .
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
Questo semplice processo sfrutta la potenza di PyTorch per eseguire operazioni matriciali complesse e calcoli di gradiente. Per chi desidera semplificare la gestione dei dati, Ultralytics offre strumenti per la formazione basata su cloud e l' auto-annotazione, rendendo il flusso di lavoro dell'apprendimento supervisionato significativamente più efficiente.