Scopri come l'apprendimento non supervisionato utilizza il clustering, la riduzione della dimensionalità e il rilevamento delle anomalie per scoprire modelli nascosti nei dati.
L'apprendimento non supervisionato è una categoria di apprendimento automatico (ML) in cui gli algoritmi vengono addestrati su dati che non hanno etichette o categorie predefinite. A differenza dell'apprendimento supervisionato, l'obiettivo non è quello di prevedere un risultato noto in base alle caratteristiche dell'input. Al contrario, il sistema cerca di apprendere da solo la struttura sottostante, i modelli e le relazioni all'interno dei dati. È come dare a un computer una grande collezione di oggetti non ordinati e chiedergli di trovare raggruppamenti naturali o caratteristiche interessanti senza dirgli cosa cercare. Questo approccio è fondamentale per esplorare insiemi di dati complessi e scoprire intuizioni che potrebbero non essere evidenti in precedenza, costituendo una parte fondamentale della moderna Intelligenza Artificiale (IA).
Nell'apprendimento non supervisionato, l'algoritmo esamina i dati in ingresso e cerca di identificare somiglianze, differenze o correlazioni tra di essi. Durante la fase di addestramento non vengono fornite risposte "corrette" o output mirati. Gli algoritmi devono dedurre la struttura intrinseca presente nei dati. Spesso si tratta di organizzare i punti di dati in gruppi(clustering), ridurre la complessità dei dati(riduzione della dimensionalità) o identificare punti di dati insoliti(rilevamento di anomalie). Il successo dei metodi non supervisionati si basa spesso sulla capacità dell'algoritmo di catturare le proprietà intrinseche del set di dati senza una guida esterna.
Diverse tecniche rientrano nell'ambito dell'apprendimento non supervisionato:
L'apprendimento non supervisionato ha varie applicazioni in diversi campi:
L'apprendimento non supervisionato si differenzia in modo significativo dagli altri approcci di ML:
L'apprendimento non supervisionato è un potente strumento per l'esplorazione dei dati, la scoperta di strutture nascoste e l'estrazione di caratteristiche preziose, spesso come primo passo fondamentale in complesse pipeline di analisi dei dati o come complemento di altre tecniche di ML. Piattaforme come Ultralytics HUB forniscono ambienti in cui possono essere sviluppati e gestiti vari modelli di ML, che potenzialmente incorporano tecniche non supervisionate per la preparazione o l'analisi dei dati. Framework come PyTorch e TensorFlow offrono ampie librerie che supportano l'implementazione di algoritmi non supervisionati.