Glossario

Aumento dei dati

Migliora i tuoi modelli di apprendimento automatico con l'aumento dei dati. Scopri le tecniche per aumentare l'accuratezza, ridurre l'overfitting e migliorare la robustezza.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'aumento dei dati è una tecnica utilizzata nell'apprendimento automatico (ML) per aumentare artificialmente la dimensione e la diversità di un set di dati di addestramento creando copie modificate di punti di dati esistenti o generando nuovi dati sintetici a partire da essi. Questo processo aiuta a migliorare le prestazioni, la generalizzazione e la robustezza dei modelli di ML, in particolare in campi come la computer vision dove la raccolta di grandi quantità di dati variegati può essere impegnativa e costosa. Esponendo modelli come Ultralytics YOLO a una gamma più ampia di variazioni durante l'addestramento, l'aumento dei dati li aiuta a ottenere prestazioni migliori su dati inediti del mondo reale.

Come funziona l'aumento dei dati

L'incremento dei dati applica varie trasformazioni ai punti dati originali per creare nuovi esempi plausibili. Per i dati delle immagini, le tecniche più comuni includono:

  • Trasformazioni geometriche: Ruotare, scalare, tradurre (spostare), capovolgere (orizzontalmente o verticalmente) e tagliare le immagini.
  • Trasformazioni dello spazio colore: Regolazione della luminosità, del contrasto, della saturazione, della tonalità o applicazione del jittering del colore.
  • Iniezione di rumore: Aggiunta di rumore casuale (ad esempio, rumore gaussiano) per simulare le imperfezioni del sensore o le condizioni di scarsa luminosità.
  • Cancellazione/ritaglio casuale: Rimozione di aree casuali da un'immagine per incoraggiare il modello a concentrarsi su parti diverse di un oggetto.
  • Miscelazione di immagini: Combinazione di più immagini, come nel caso dell'aumento del mosaico (utilizzato in modelli come YOLOv4) o di MixUp, per creare campioni di allenamento compositi.

Sebbene siano molto diffuse nell'ambito della computer vision, le tecniche di incremento esistono anche per altri tipi di dati, come la sostituzione dei sinonimi o la retro-traduzione dei dati testuali nell'ambito dell'elaborazione del linguaggio naturale (NLP).

Importanza e vantaggi

L'aumento dei dati offre diversi vantaggi chiave nello sviluppo di modelli ML:

  • Riduce i problemi di scarsità di dati: Espande i dataset limitati, rendendo possibile l'addestramento di modelli complessi come le reti neurali profonde anche quando non sono disponibili grandi quantità di dati originali.
  • Previene l'overfitting: Introducendo variazioni, l'aumento aiuta a evitare che i modelli si limitino a memorizzare i dati di formazione(overfitting) e li incoraggia ad apprendere caratteristiche più generalizzabili. Leggi i nostri consigli sull'addestramento dei modelli per ulteriori strategie.
  • Migliora la robustezza del modello: L'addestramento su dati aumentati rende i modelli meno sensibili alle variazioni di input, come ad esempio i cambiamenti di illuminazione, orientamento o scala, migliorando le prestazioni in diverse condizioni del mondo reale.
  • Efficienza in termini di costi e tempi: Spesso è più economico e veloce aumentare i dati esistenti piuttosto che raccogliere ed etichettare nuovi dati.

Tecniche e strumenti

Diverse librerie semplificano l'implementazione delle tecniche di aumento dei dati. Per le attività di computer vision, gli strumenti più diffusi sono:

I modelli Ultralytics incorporano diverse tecniche di incremento e gli utenti possono gestire i dataset e i modelli utilizzando piattaforme come Ultralytics HUB.

Applicazioni del mondo reale

L'aumento dei dati è ampiamente utilizzato in diversi ambiti:

  1. Immagini mediche: Nel settore sanitario, ottenere grandi e diversi set di immagini mediche (come radiografie o TAC) può essere difficile a causa delle norme sulla privacy e della rarità di alcune condizioni. L'aumento dei dati (ad esempio la rotazione, lo zoom, la regolazione del contrasto) aiuta ad addestrare modelli robusti per compiti come il rilevamento dei tumori o la classificazione delle malattie, migliorando l'accuratezza diagnostica. Si tratta di una parte fondamentale del progresso dell 'IA nell'assistenza sanitaria.
  2. Veicoli autonomi: Le auto a guida autonoma si basano molto sul rilevamento degli oggetti per percepire l'ambiente circostante. Aumentare le immagini di addestramento simulando diverse condizioni atmosferiche (pioggia, nebbia), illuminazione (giorno, notte), aggiungendo occlusioni o variando la prospettiva degli oggetti aiuta a garantire che il sistema di percezione del veicolo funzioni in modo affidabile in diversi scenari di guida. Questo migliora la sicurezza nelle applicazioni di AI per il settore automobilistico.

Aumento dei dati e dati sintetici

Sebbene sia correlato, l'aumento dei dati è distinto dalla generazione di dati sintetici. L'incremento dei dati comporta tipicamente l'applicazione di trasformazioni a punti di dati reali esistenti per creare versioni leggermente modificate. Al contrario, i dati sintetici si riferiscono a dati completamente nuovi generati artificialmente, spesso utilizzando simulazioni, algoritmi o modelli generativi come le GAN, senza necessariamente partire da un dato reale. Entrambe le tecniche mirano a migliorare i set di dati, ma i dati sintetici possono potenzialmente creare scenari non presenti nei dati originali, mentre l'incremento aumenta principalmente la varianza dei dati esistenti.

Leggi tutto