Scopri come l'apprendimento semi-supervisionato combina dati etichettati e non etichettati per migliorare i modelli di intelligenza artificiale, ridurre i costi di etichettatura e aumentare la precisione.
L'apprendimento semi-supervisionato (SSL) è un tipo di tecnica di apprendimento automatico (ML) che si colloca tra l'apprendimento supervisionato e l'apprendimento non supervisionato. Utilizza una combinazione di una piccola quantità di dati etichettati e una grande quantità di dati non etichettati per addestrare i modelli. La motivazione principale che sta alla base della SSL è l'elevato costo e lo sforzo spesso associato all'etichettatura dei dati, soprattutto in domini complessi. Sfruttando i dati non etichettati prontamente disponibili, SSL mira a migliorare le prestazioni e la generalizzazione dei modelli rispetto a quanto si potrebbe ottenere utilizzando solo i limitati dati etichettati.
Il principio fondamentale dell'apprendimento semi-supervisionato è che i dati non etichettati, nonostante la mancanza di etichette esplicite, contengono informazioni preziose sulla struttura e sulla distribuzione sottostante dei dati. Gli algoritmi SSL cercano di sfruttare questa struttura per migliorare il processo di apprendimento. Gli approcci più comuni spesso prevedono la formulazione di ipotesi sui dati, come l'ipotesi del cluster (è probabile che i punti dello stesso cluster abbiano la stessa etichetta) o l'ipotesi del collettore (i punti dei dati si trovano su un collettore a bassa dimensione).
Le tecniche utilizzate in SSL includono metodi come la pseudo-etichettatura, in cui un modello addestrato sui dati etichettati iniziali viene utilizzato per prevedere le etichette dei dati non etichettati. Le previsioni ad alta affidabilità vengono poi trattate come "pseudo-etichette" e aggiunte al set di formazione. Un altro approccio prevede la regolarizzazione della coerenza, che incoraggia il modello a produrre output simili per versioni perturbate dello stesso input non etichettato, spesso ottenute attraverso tecniche come l'aumento dei dati. Questi metodi aiutano il modello ad apprendere caratteristiche più robuste utilizzando il vasto set di dati non etichettati. Puoi trovare una buona panoramica della SSL su Towards Data Science.
L'apprendimento semi-supervisionato è particolarmente utile negli scenari in cui l'ottenimento di dati etichettati è un collo di bottiglia. Alcune aree di applicazione chiave includono:
È importante distinguere l'apprendimento semi-supervisionato dai paradigmi di ML correlati:
L'apprendimento semi-supervisionato offre un approccio pratico e potente per la creazione di sistemi di Intelligenza Artificiale (IA) efficaci, in particolare in compiti di computer vision come il rilevamento di oggetti in cui le immagini o i video non etichettati sono abbondanti. Piattaforme come Ultralytics HUB facilitano la gestione di insiemi di dati che potrebbero includere mix di dati etichettati e non etichettati per l'addestramento di modelli quali Ultralytics YOLO. L'esplorazione delle tecniche SSL può essere fondamentale per i progetti che devono affrontare limitazioni nella disponibilità di dati etichettati, come evidenziato in risorse come i post del Google AI Blog sull'SSL.