Glossario

Active Learning

Scopri come l'Active Learning ottimizza la formazione sull'intelligenza artificiale. Impara a utilizzare Ultralytics per identificare dati informativi, ridurre i costi di etichettatura e aumentare la precisione.

L'apprendimento attivo è un approccio strategico nel machine learning (ML) in cui l'algoritmo seleziona in modo proattivo i punti dati più informativi per l'etichettatura, invece di accettare passivamente un set di dati pre-etichettato . Nell'apprendimento supervisionato tradizionale, i modelli richiedono spesso enormi quantità di dati annotati, la cui creazione può essere costosa e richiedere molto tempo. L'apprendimento attivo ottimizza questo processo identificando gli esempi "incerti" o "difficili", quelli vicini al limite decisionale o in cui il modello manca di sicurezza, e richiedendo agli annotatori umani di etichettare solo quelle specifiche istanze. Questo ciclo iterativo consente ai modelli di raggiungere un'elevata precisione con un numero significativamente inferiore di campioni etichettati, rendendolo altamente efficiente per progetti con budget limitati o vincoli di tempo.

Come funziona il ciclo di apprendimento attivo

Il nucleo dell'apprendimento attivo è un ciclo di feedback spesso indicato come human-in-the-loop. Invece di addestrare una volta su un set di dati statico, il modello si evolve attraverso cicli di query e aggiornamenti.

Inizializzazione: il processo inizia con un piccolo set di dati di addestramento etichettati utilizzati per addestrare un modello iniziale, come Ultralytics .
Selezione delle query: il modello valuta un ampio pool di dati non etichettati. Utilizzando una strategia di query, più comunemente il campionamento di incertezza, seleziona le immagini o il testo in cui le sue previsioni sono meno affidabili.
Annotazione: questi campioni ad alta priorità vengono inviati a un esperto umano, spesso chiamato "oracolo" nella letteratura sull'apprendimento attivo, per l' etichettatura dei dati.
Riqualificazione: i dati appena etichettati vengono aggiunti al set di addestramento e il modello viene riqualificato. Questo modello aggiornato è quindi più adatto a selezionare il prossimo lotto di campioni confusi.

Applicazioni nel mondo reale

L'apprendimento attivo è indispensabile nei settori in cui i dati sono abbondanti, ma l'etichettatura richiede conoscenze specialistiche o costi elevati.

Analisi delle immagini mediche: In campi come la radiologia, l'etichettatura richiede esperti certificati il cui tempo è estremamente prezioso. Piuttosto che chiedere a un medico di annotare migliaia di scansioni chiare, un sistema di apprendimento attivo può filtrare i casi ambigui , come tumori in fase iniziale o anomalie rare, consentendo all'esperto di concentrarsi solo sulle immagini che migliorano realmente la capacità diagnostica del modello.
Veicoli autonomi: le auto a guida autonoma generano petabyte di dati video. Etichettare ogni fotogramma è impossibile. L'apprendimento attivo aiuta gli ingegneri a identificare casi limite, come pedoni che indossano costumi o guidano in condizioni di neve intensa, che i modelli standard di rilevamento degli oggetti potrebbero non rilevare. Dando la priorità a questi scenari rari, le aziende migliorano la sicurezza senza sprecare risorse su filmati ripetitivi delle autostrade.

Python : Filtraggio delle previsioni incerte

Il seguente esempio illustra una semplice logica di "campionamento dell'incertezza" utilizzando Ultralytics . Carichiamo un modello, eseguiamo l'inferenza sulle immagini e contrassegniamo quelle il cui punteggio di affidabilità è inferiore a una determinata soglia per la revisione manuale.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# List of unlabeled image paths
unlabeled_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference
results = model(unlabeled_images)

# Identify samples with low confidence for active learning
uncertain_threshold = 0.6
for result in results:
    # Check if any detection confidence is below the threshold
    if result.boxes.conf.numel() > 0 and result.boxes.conf.min() < uncertain_threshold:
        print(f"Active Learning Query: {result.path} needs human labeling.")

Distinguere i concetti correlati

È importante distinguere l'apprendimento attivo da paradigmi formativi simili:

Apprendimento semi-supervisionato: Sebbene entrambi i metodi utilizzino dati non etichettati, l'apprendimento semi-supervisionato assegna automaticamente pseudo-etichette ai dati sulla base delle previsioni ad alta affidabilità del modello . Al contrario, l'apprendimento attivo richiede esplicitamente l'intervento umano sulle previsioni a bassa affidabilità.
Apprendimento trasferito: consiste nell'utilizzare un modello pre-addestrato (come quelli addestrati su ImageNet) e adattarlo a un nuovo compito. L'apprendimento attivo si concentra su quali dati etichettare, mentre l'apprendimento per trasferimento si concentra sul riutilizzo delle caratteristiche apprese.
Apprendimento per rinforzo: in questo caso, un agente apprende interagendo con un ambiente e ricevendo ricompense. L'apprendimento attivo è diverso perché cerca etichette statiche di verità di base da un oracolo, piuttosto che ottimizzare una sequenza di azioni per ottenere una ricompensa.

Integrazione con MLOps

L'implementazione efficace dell'apprendimento attivo richiede una solida pipeline di operazioni di apprendimento automatico (MLOps) . È necessaria un'infrastruttura per gestire il versioning dei dati, attivare i lavori di riqualificazione e fornire l'interfaccia di annotazione agli utenti. Gli strumenti che si integrano con Ultralytics consentono agli utenti di passare senza soluzione di continuità dall' inferenza alla curazione dei dati e alla formazione. Ad esempio, l'utilizzo di script di formazione personalizzati consente agli sviluppatori di incorporare rapidamente nuovi batch di dati di apprendimento attivo nei loro YOLO .

Per ulteriori approfondimenti sulle strategie di campionamento, i ricercatori fanno spesso riferimento a indagini complete nella letteratura sull'apprendimento attivo. Inoltre, la comprensione delle metriche di valutazione dei modelli è fondamentale per verificare che il ciclo di apprendimento attivo stia effettivamente migliorando le prestazioni.

Active Learning

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Come funziona il ciclo di apprendimento attivo

Applicazioni nel mondo reale

Python : Filtraggio delle previsioni incerte

Distinguere i concetti correlati

Integrazione con MLOps

Leggi di più in questa categoria

12 casi d'uso delle immagini aeree basati sulla visione artificiale

Che cos'è la stima della profondità monoculare? Una panoramica

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Unitevi alla comunità di Ultralytics