Glossario

Apprendimento non supervisionato

Scopri come l'apprendimento non supervisionato utilizza il clustering, la riduzione della dimensionalità e il rilevamento delle anomalie per scoprire modelli nascosti nei dati.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'apprendimento non supervisionato è un tipo di apprendimento automatico (ML) in cui gli algoritmi apprendono modelli da dati non etichettati. A differenza dell'apprendimento supervisionato, che si basa su etichette predefinite o "risposte corrette", i metodi non supervisionati esplorano la struttura intrinseca dei dati per scoprire relazioni nascoste, raggruppamenti o anomalie senza una guida preliminare. Questo approccio è particolarmente utile nell'Intelligenza Artificiale (IA) per l'esplorazione iniziale dei dati e la comprensione di insiemi di dati complessi in cui l'etichettatura è impraticabile o impossibile. Permette ai modelli di scoprire schemi e intuizioni direttamente dai dati.

Come funziona l'apprendimento non supervisionato

L'obiettivo principale dell'apprendimento non supervisionato è quello di modellare la struttura o la distribuzione sottostante dei dati per imparare di più su di essi. Gli algoritmi sono lasciati liberi di scoprire da soli somiglianze, differenze e strutture. Le tecniche più comuni includono:

Applicazioni dell'apprendimento non supervisionato

Le tecniche di apprendimento non supervisionato vengono impiegate in diversi scenari reali, in particolare quando si ha a che fare con grandi volumi di dati non etichettati:

  • Segmentazione dei clienti: Le aziende utilizzano il clustering per raggruppare i clienti con comportamenti, preferenze o dati demografici simili. In questo modo è possibile realizzare campagne di marketing mirate e personalizzate. Scopri di più sulla segmentazione dei clienti.
  • Rilevamento delle anomalie: Gli algoritmi non supervisionati eccellono nell'identificare punti di dati insoliti o anomalie che si discostano significativamente dalla norma. Questo aspetto è fondamentale per applicazioni come il rilevamento di frodi in ambito finanziario, l'individuazione di intrusioni nella rete o l'identificazione di difetti nella produzione.

Rilevanza nell'AI e nel ML

L'apprendimento non supervisionato svolge un ruolo cruciale nel dare un senso alle grandi quantità di dati grezzi e non etichettati che caratterizzano i Big Data. Spesso è un passo essenziale nella pre-elaborazione dei dati e nell'ingegneria delle caratteristiche, aiutando a scoprire strutture nascoste o a ridurre la complessità dei dati prima di applicare altre tecniche di ML. Mentre i modelli come Ultralytics YOLO vengono addestrati principalmente con metodi supervisionati per attività come il rilevamento di oggetti, la comprensione delle strutture dei dati attraverso metodi non supervisionati può aiutare in modo significativo la preparazione e l'analisi dei dataset, migliorando potenzialmente le prestazioni del modello. Puoi esplorare le guide alla raccolta e all'annotazione dei dati per preparare i set di dati e gestire i dati e i modelli utilizzando piattaforme come Ultralytics HUB.

Apprendimento non supervisionato vs. altri tipi di apprendimento

È importante distinguere l'apprendimento non supervisionato dai paradigmi correlati di Deep Learning (DL) e ML:

  • Apprendimento supervisionato: Richiede un set di dati completamente etichettati, ovvero ogni punto di dati ha un'uscita o una categoria nota. L'obiettivo è quello di addestrare un modello in grado di prevedere con precisione l'output di nuovi punti di dati non visti, basandosi sugli esempi etichettati.
  • Apprendimento auto-supervisionato: Spesso considerato un tipo di apprendimento non supervisionato, genera automaticamente le etichette dai dati di input stessi creando compiti pre-testuali (ad esempio, la previsione di una parte nascosta di un'immagine). È molto utilizzato per il pre-training di modelli di grandi dimensioni, compresi quelli basati sull'architettura Transformer.
  • Apprendimento semi-supervisionato: Utilizza una combinazione di una piccola quantità di dati etichettati e una grande quantità di dati non etichettati. Questo approccio mira a sfruttare i dati non etichettati per migliorare l'accuratezza dell'apprendimento rispetto a quanto sarebbe possibile con i soli dati etichettati. Esplora ulteriormente l'apprendimento semi-supervisionato.

L'apprendimento non supervisionato rimane un'area fondamentale del ML, che guida la scoperta e la comprensione di insiemi di dati complessi in cui le etichette sono scarse o non disponibili.

Leggi tutto