Glossaire

Apprentissage semi-supervisé

Découvrez comment l'apprentissage semi-supervisé combine des données étiquetées et non étiquetées pour améliorer les modèles d'IA, réduire les coûts d'étiquetage et augmenter la précision.

L'apprentissage semi-supervisé (SSL) est une technique d'apprentissage automatique qui comble le fossé entre l'apprentissage supervisé et l'apprentissage non supervisé. Il tire parti d'une petite quantité de données étiquetées et d'une grande quantité de données non étiquetées pour améliorer la précision de l'apprentissage. Dans de nombreux scénarios réels, l'acquisition de données non étiquetées est peu coûteuse, mais le processus d'étiquetage des données est coûteux et prend du temps. SSL relève ce défi en permettant aux modèles d'apprendre à partir du vaste ensemble d'exemples non étiquetés, guidés par la structure et les informations fournies par l'ensemble étiqueté plus petit. Cette approche est particulièrement puissante dans l'apprentissage profond (DL), où les modèles nécessitent d'énormes ensembles de données pour atteindre des performances élevées.

Fonctionnement de l'apprentissage semi-supervisé

L'idée centrale de SSL est d'utiliser les données étiquetées pour construire un modèle initial, puis d'utiliser ce modèle pour faire des prédictions sur les données non étiquetées. Les prédictions les plus fiables du modèle sont alors traitées comme des "pseudo-étiquettes" et ajoutées à l'ensemble d'entraînement. Le modèle est ensuite réentraîné sur cette combinaison d'étiquettes originales et de pseudo-étiquettes de confiance. Ce processus itératif permet au modèle d'apprendre la structure sous-jacente de l'ensemble des données, et pas seulement de la petite partie étiquetée.

Les techniques SSL les plus courantes sont les suivantes :

  • Régularisation de la cohérence : Cette méthode renforce l'idée que les prédictions du modèle doivent rester cohérentes même lorsque les données d'entrée sont légèrement perturbées. Par exemple, une image dont les données ont été légèrement augmentées doit donner lieu à la même classification.
  • Modèles génératifs : Des techniques telles que les réseaux adverbiaux génératifs (GAN) peuvent apprendre à générer des données qui ressemblent à la véritable distribution des données, ce qui permet de mieux définir les limites de décision entre les classes.
  • Méthodes basées sur les graphes : Ces méthodes représentent les points de données comme des nœuds dans un graphe et propagent les étiquettes des nœuds étiquetés aux nœuds non étiquetés en fonction de leur proximité ou de leur similarité. Une vue d'ensemble technique peut être trouvée dans les études universitaires.

Applications dans le monde réel

SSL est très efficace dans les domaines où l'étiquetage est un goulot d'étranglement. En voici deux exemples marquants :

  1. Analyse d'images médicales: L'étiquetage de scans médicaux tels que les IRM ou les CT pour la détection de tumeurs nécessite des radiologues experts et est très coûteux. Avec SSL, un modèle peut être formé sur quelques centaines de scans étiquetés, puis affiné en utilisant des milliers de scans non étiquetés provenant des archives de l'hôpital. Cela permet de développer des modèles robustes de classification et de segmentation d' images avec beaucoup moins d'efforts manuels.
  2. Classification des contenus et des documents Web : La classification manuelle de milliards de pages web, d'articles de presse ou d'avis de clients n'est pas pratique. SSL peut utiliser un petit ensemble de documents classés manuellement pour former un classificateur de texte initial. Le modèle classifie ensuite le corpus massif de documents non étiquetés, en utilisant ses propres prédictions pour s'améliorer au fil du temps dans des tâches telles que l'analyse des sentiments ou la catégorisation des sujets.

Comparaison avec d'autres paradigmes d'apprentissage

Il est important de distinguer le SSL des concepts apparentés à l'intelligence artificielle (IA):

  • Apprentissage auto-supervisé (SSL): Bien qu'il partage le même acronyme, l'apprentissage auto-supervisé est différent. Il s'agit d'un type d'apprentissage non supervisé dans lequel les étiquettes sont générées à partir des données elles-mêmes par le biais de tâches préalables (par exemple, prédire un mot masqué dans une phrase). Il n'utilise aucune donnée étiquetée manuellement, alors que l'apprentissage semi-supervisé nécessite un petit ensemble de données explicitement étiquetées pour guider le processus de formation du modèle.
  • Apprentissage actif: Cette technique vise également à réduire les coûts d'étiquetage. Cependant, au lieu d'utiliser toutes les données non étiquetées, un modèle d'apprentissage actif demande intelligemment à un annotateur humain d'étiqueter les points de données les plus informatifs. SSL, en revanche, utilise généralement les données non étiquetées sans interaction humaine directe au cours de la formation.
  • Apprentissage par transfert: Il s'agit d'utiliser un modèle pré-entraîné sur un grand ensemble de données (comme ImageNet) et de l'affiner ensuite sur un ensemble de données plus petit et spécifique à une tâche. Bien que les deux méthodes exploitent les connaissances existantes, la méthode SSL apprend à partir des données non étiquetées de la tâche cible elle-même, tandis que l'apprentissage par transfert exploite les connaissances d'une tâche différente (bien que souvent apparentée).

Outils et formation

De nombreux frameworks modernes de Deep Learning (DL), dont PyTorch(PyTorch official site) et TensorFlow(TensorFlow official site), offrent des fonctionnalités ou peuvent être adaptés pour mettre en œuvre des algorithmes SSL. Des bibliothèques comme Scikit-learn fournissent certaines méthodes SSL. Des plateformes telles que Ultralytics HUB rationalisent le processus en facilitant la gestion des ensembles de données qui peuvent contenir des mélanges de données étiquetées et non étiquetées, ce qui simplifie la formation et le déploiement de modèles conçus pour exploiter de telles structures de données. La recherche en SSL continue d'évoluer et les contributions sont souvent présentées lors de grandes conférences sur l'IA telles que NeurIPS et ICML.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers