Glossaire

Apprentissage actif

Découvre l'apprentissage actif, une méthode d'apprentissage automatique rentable qui booste la précision avec moins d'étiquettes. Découvre comment elle transforme la formation à l'IA !

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'apprentissage actif est une approche spécialisée de l'apprentissage automatique dans laquelle l'algorithme joue un rôle actif dans la sélection des données à partir desquelles il apprend. Contrairement à l'apprentissage supervisé traditionnel, qui s'appuie sur des ensembles de données entièrement étiquetés, l'apprentissage actif demande intelligemment des étiquettes sur des points de données spécifiques qu'il juge les plus informatifs. Cette approche ciblée permet au modèle d'atteindre une grande précision avec beaucoup moins d'exemples étiquetés, ce qui en fait une stratégie rentable et efficace pour former des modèles d'apprentissage automatique, en particulier lorsqu'il s'agit de grands ensembles de données non étiquetées.

Comment fonctionne l'apprentissage actif

Dans l'apprentissage actif, le modèle interagit itérativement avec un oracle (généralement un annotateur humain) pour demander des étiquettes pour les points de données les plus précieux. Le processus suit généralement les étapes suivantes :

  1. Formation initiale : Le modèle est initialement formé sur un petit ensemble de données étiquetées.
  2. Échantillonnage d'incertitude : Le modèle identifie les points de données pour lesquels il est le plus incertain quant à l'étiquette correcte. Il existe diverses stratégies pour quantifier l'incertitude, comme l'interrogation des instances dont la confiance en la prédiction est la plus faible ou dont les différents modèles d'un ensemble sont le plus en désaccord.
  3. Interrogation : Le modèle interroge l'oracle pour obtenir les étiquettes des points de données sélectionnés.
  4. Mise à jour du modèle : les données nouvellement étiquetées sont ajoutées à l'ensemble de formation et le modèle est entraîné à nouveau.
  5. Itération : Les étapes 2 à 4 sont répétées jusqu'à ce qu'un niveau de précision souhaité soit atteint ou qu'un budget d'étiquetage soit épuisé.

L'apprentissage actif est particulièrement utile lorsque l'étiquetage des données est coûteux, prend du temps ou nécessite une expertise spécialisée. En sélectionnant stratégiquement les points de données à étiqueter, l'apprentissage actif minimise l'effort d'étiquetage tout en maximisant les performances du modèle.

Principaux avantages de l'apprentissage actif

L'apprentissage actif offre plusieurs avantages par rapport à l'apprentissage supervisé traditionnel :

  • Coûts d'étiquetage réduits : En se concentrant sur les points de données les plus informatifs, l'apprentissage actif réduit considérablement la quantité de données étiquetées nécessaires pour former un modèle très performant.
  • Formation plus rapide : Avec moins d'exemples étiquetés nécessaires, le temps de formation peut être considérablement réduit, en particulier pour les modèles complexes.
  • Amélioration de la précision du modèle : L'apprentissage actif permet souvent d'obtenir de meilleures performances des modèles par rapport aux modèles formés sur des données étiquetées sélectionnées au hasard, car il donne la priorité aux instances les plus difficiles et les plus informatives.
  • Utilisation efficace des ressources : L'apprentissage actif optimise l'utilisation des ressources en minimisant les efforts consacrés à l'étiquetage des points de données moins informatifs.

Applications concrètes de l'apprentissage actif

L'apprentissage actif trouve des applications dans divers domaines où les données étiquetées sont rares ou coûteuses à obtenir. Voici deux exemples concrets :

Analyse d'images médicales

Dans l'analyse d'images médicales, l'obtention d'annotations de la part d'experts médicaux peut être coûteuse et prendre du temps. L'apprentissage actif peut être employé pour identifier les images médicales les plus critiques qui nécessitent l'étiquetage d'un expert, comme celles qui présentent des caractéristiques ambiguës ou des conditions rares. Cette approche ciblée permet de développer des modèles de diagnostic précis avec moins d'images étiquetées, ce qui accélère le développement d'outils médicaux alimentés par l'IA.

Détection d'objets dans les véhicules autonomes

L'entraînement des modèles de détection d'objets pour les véhicules autonomes nécessite de grandes quantités de données étiquetées représentant divers scénarios de conduite. L'apprentissage actif peut aider à donner la priorité à l'étiquetage des points de données les plus difficiles pour le modèle, tels que des conditions d'éclairage inhabituelles, des objets occultés ou des situations de circulation rares. Cela garantit que le modèle est formé sur les données les plus informatives, ce qui permet d'améliorer la sécurité et la fiabilité des systèmes de conduite autonome. Ce n'est qu'une des nombreuses applications de la vision par ordinateur dans les véhicules autonomes.

Apprentissage actif et autres paradigmes d'apprentissage

Il est important de distinguer l'apprentissage actif des autres paradigmes d'apprentissage apparentés :

  • Apprentissage supervisé : Dans l'apprentissage supervisé traditionnel, le modèle est formé sur un ensemble de données fixe avec des étiquettes complètes. L'apprentissage actif, en revanche, sélectionne dynamiquement les points de données à étiqueter pendant le processus de formation.
  • Apprentissage semi-supervisé : L'apprentissage semi-supervisé utilise à la fois des données étiquetées et non étiquetées pour la formation. Si l'apprentissage actif et l'apprentissage semi-supervisé visent tous deux à exploiter les données non étiquetées, l'apprentissage actif demande activement des étiquettes, tandis que l'apprentissage semi-supervisé utilise généralement les données non étiquetées pour améliorer la compréhension par le modèle de la distribution sous-jacente des données.
  • Apprentissage par renforcement : L'apprentissage par renforcement implique qu'un agent apprenne par essais et erreurs en interagissant avec un environnement. Contrairement à l'apprentissage actif, où un modèle interroge un oracle pour obtenir des étiquettes, l'apprentissage par renforcement se concentre sur l'apprentissage d'actions optimales basées sur des récompenses et des pénalités.

Apprentissage actif et Ultralytics

Ultralytics offre des solutions de pointe pour la détection d'objets, notamment les puissants modèles Ultralytics YOLO . Bien que Ultralytics n'offre pas actuellement de support direct pour les flux de travail d'apprentissage actif, les résultats et les informations générés par les modèles YOLO peuvent être exploités pour mettre en œuvre des stratégies d'apprentissage actif. Par exemple, les scores de confiance du modèle pour les détections d'objets peuvent être utilisés pour identifier les instances incertaines à étiqueter.

De plus, Ultralytics fournit une suite d'outils et de ressources pour la formation, la validation et le déploiement des modèles YOLO . Ces outils peuvent être intégrés dans des pipelines d'apprentissage actif personnalisés afin de rationaliser le développement de systèmes de détection d'objets. Tu peux explorer ces capacités plus en détail sur la page de documentationUltralytics .

L'apprentissage actif représente un paradigme puissant pour former efficacement des modèles d'apprentissage automatique, en particulier lorsque les données étiquetées sont rares ou coûteuses. En sélectionnant intelligemment les points de données les plus informatifs pour l'étiquetage, l'apprentissage actif réduit les coûts, accélère la formation et améliore la précision des modèles. Alors que la demande de solutions d'IA augmente dans divers secteurs, l'apprentissage actif est appelé à jouer un rôle de plus en plus important dans le développement de systèmes d'apprentissage automatique robustes et efficaces.

Tout lire