Glossario

Aumento dei dati

Migliora i tuoi modelli di apprendimento automatico con l'aumento dei dati. Scopri le tecniche per aumentare l'accuratezza, ridurre l'overfitting e migliorare la robustezza.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'aumento dei dati è una tecnica cruciale nell'apprendimento automatico (ML) utilizzata per espandere artificialmente le dimensioni e la diversità di un set di dati di addestramento. Ciò si ottiene creando versioni modificate dei dati esistenti o generando nuovi esempi sintetici basati su di essi. L'obiettivo principale è quello di migliorare le prestazioni, le capacità di generalizzazione e la robustezza dei modelli di ML, soprattutto in domini come la computer vision (CV) dove l'acquisizione di dataset ampi e variegati può essere costosa e richiedere molto tempo. Addestrando modelli come Ultralytics YOLO su dati aumentati, gli sviluppatori possono aiutarli a imparare a gestire una gamma più ampia di variazioni che si incontrano negli scenari del mondo reale, ottenendo una migliore precisione sui dati non visti.

Come funziona l'aumento dei dati

L'idea alla base dell'incremento dei dati è quella di applicare varie trasformazioni ai campioni di dati originali per generare nuovi esempi di addestramento plausibili. Queste trasformazioni dovrebbero idealmente riflettere le variazioni che il modello potrebbe incontrare durante l'inferenza. Per quanto riguarda i dati delle immagini, che sono uno degli obiettivi principali della computer vision, le tecniche di incremento più comuni includono:

  • Trasformazioni geometriche: Alterazione delle proprietà spaziali dell'immagine, come la rotazione, il ridimensionamento (ingrandimento o riduzione), la traslazione (spostamento), il taglio e il capovolgimento (orizzontale o verticale).
  • Trasformazioni dello spazio colore: Modifica delle caratteristiche del colore, comprese le regolazioni di luminosità, contrasto, saturazione e tonalità. Questi aiutano i modelli a diventare meno sensibili alle condizioni di luce e alle variazioni della fotocamera.
  • Aggiunta di rumore: introduzione di un rumore casuale (come il rumore gaussiano) per simulare il rumore del sensore o la qualità imperfetta dell'immagine.
  • Cancellazione casuale / Ritaglio: Mascheratura di regioni rettangolari casuali di un'immagine per incoraggiare il modello a concentrarsi su parti diverse degli oggetti e migliorare la robustezza contro l'occlusione.
  • Miscelazione di immagini: Combinare più immagini o parti di immagini. Tecniche come Mixup (interpolazione tra due immagini e le loro etichette) e CutMix (incollare una patch da un'immagine a un'altra) costringono il modello a imparare da esempi meno puliti.

Sebbene siano molto utilizzate nel campo delle CV, le tecniche di incremento vengono applicate anche in altri campi. Ad esempio, nell'elaborazione del linguaggio naturale (NLP), metodi come la sostituzione dei sinonimi, la retro-traduzione (traduzione del testo in un'altra lingua e ritorno) e l'inserimento/cancellazione casuale di parole possono aumentare i dati di testo.

Importanza e vantaggi

L'aumento dei dati è una parte fondamentale del flusso di lavoro del ML per diversi motivi:

  • Miglioramento della generalizzazione del modello: Esponendo il modello a un maggior numero di esempi diversi, l'aumento aiuta il modello ad apprendere i modelli sottostanti piuttosto che a memorizzare esempi di formazione specifici, migliorando le prestazioni su nuovi dati.
  • Riduzione dell'overfitting: L'overfitting si verifica quando un modello si comporta bene sui dati di addestramento ma male sui dati non visti. L'aumento agisce come una tecnica di regolarizzazione, rendendo più difficile per il modello adattarsi eccessivamente al limitato set di dati originali.
  • Maggiore robustezza: I modelli addestrati con dati aumentati sono in genere più resistenti alle variazioni di input, come i cambiamenti di illuminazione, di punto di vista, di scala o le occlusioni parziali.
  • Riduzione delle esigenze di raccolta dati: Permette agli sviluppatori di ottenere risultati migliori con set di dati iniziali più piccoli, risparmiando tempo e risorse associate alla raccolta e all'etichettatura dei dati. Per ulteriori suggerimenti sulla formazione dei modelli, consulta la nostra documentazione.

Tecniche e strumenti

L'implementazione dell'aumento dei dati è facilitata da diverse librerie e framework. Per le attività di computer vision, alcuni strumenti popolari includono:

I modelli Ultralytics incorporano diverse efficaci tecniche di incremento durante l'addestramento. Gli utenti possono gestire i loro set di dati e sfruttare queste funzionalità attraverso piattaforme come Ultralytics HUB.

Applicazioni del mondo reale

L'aumento dei dati è ampiamente applicato in numerosi ambiti dell'intelligenza artificiale:

  1. L'intelligenza artificiale nell'assistenza sanitaria: Nell'analisi delle immagini mediche, come il rilevamento dei tumori nelle scansioni, i set di dati sono spesso limitati a causa di problemi di privacy e della rarità di alcune condizioni. Le tecniche di ampliamento come la rotazione, il ridimensionamento e la regolazione della luminosità creano esempi di addestramento diversificati, aiutando i modelli a rilevare in modo affidabile le anomalie nonostante le variazioni delle apparecchiature di imaging o del posizionamento del paziente. Questo migliora l'accuratezza diagnostica dei sistemi di analisi delle immagini mediche.
  2. AI per il settore automobilistico: Lo sviluppo di sistemi robusti di rilevamento degli oggetti per i veicoli autonomi richiede dati di addestramento che coprano diversi scenari di guida. L'aumento simula diverse condizioni atmosferiche (ad esempio, aggiungendo pioggia o nebbia sintetica), variazioni di illuminazione (giorno, notte, alba/tramonto) e occlusioni (ad esempio, pedoni o veicoli parzialmente nascosti), rendendo i sistemi di percezione più affidabili negli imprevedibili ambienti del mondo reale.
  3. AI in agricoltura: Per compiti come il rilevamento delle malattie delle colture o il conteggio dei frutti, l'aumento può simulare le variazioni di illuminazione dovute alle condizioni atmosferiche o all'ora del giorno, ai diversi stadi di crescita o alle angolazioni delle telecamere dei droni o dei robot a terra, portando a soluzioni di agricoltura di precisione più robuste.
  4. L'intelligenza artificiale nella produzione: Nel controllo qualità, l'aumento può creare variazioni nell'orientamento dei prodotti, nell'illuminazione e nei difetti minori per addestrare i modelli a un rilevamento più affidabile delle anomalie sulle linee di produzione.

Aumento dei dati e dati sintetici

Sebbene sia l'aumento dei dati che la generazione di dati sintetici mirino a migliorare i dataset di formazione, differiscono in modo sostanziale:

  • Aumento dei dati: Modifica i dati reali esistenti attraverso trasformazioni. Aumenta la varianza intorno ai punti di dati osservati, ma in genere non introduce scenari completamente nuovi non rappresentati nei dati originali.
  • Dati sintetici: Comporta la creazione di dati artificiali completamente nuovi, partendo da zero, spesso utilizzando simulazioni, grafica computerizzata o modelli generativi come le GAN (Generative Adversarial Networks) o i modelli di diffusione. I dati sintetici possono rappresentare scenari rari o impossibili da catturare nel mondo reale, colmando potenzialmente le lacune che l'aumento non può colmare.

In pratica, l'aumento dei dati è spesso più facile da implementare e computazionalmente più economico della generazione di dati sintetici ad alta fedeltà. Entrambe le tecniche possono essere preziose e a volte vengono utilizzate in combinazione per creare insiemi di dati di addestramento altamente diversificati e robusti per le applicazioni di IA più esigenti.

Leggi tutto