Glossaire

Augmentation des données

Améliore tes modèles d'apprentissage automatique grâce à l'augmentation des données. Découvre des techniques pour booster la précision, réduire l'overfitting et améliorer la robustesse.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'augmentation des données est une technique utilisée en apprentissage automatique pour augmenter artificiellement la taille d'un ensemble de données de formation en créant des versions modifiées de données existantes. Ce processus consiste à appliquer diverses transformations aux données d'origine, telles que la rotation, le retournement, la mise à l'échelle ou le recadrage des images. En augmentant la diversité des données de formation, l'augmentation des données permet d'améliorer la capacité de généralisation des modèles d'apprentissage automatique, ce qui les rend plus robustes et moins sujets à l'overfitting. L'ajustement excessif se produit lorsqu'un modèle apprend trop bien les données d'entraînement, y compris le bruit et les valeurs aberrantes, ce qui peut entraîner de mauvaises performances sur de nouvelles données inédites.

Avantages de l'augmentation des données

L'augmentation des données offre plusieurs avantages clés. Tout d'abord, elle permet de réduire le surajustement en exposant le modèle à un plus grand nombre de variations au cours de la formation. Cela rend le modèle moins sensible aux caractéristiques spécifiques des données d'apprentissage et plus apte à se généraliser à de nouvelles données inédites. Deuxièmement, cela peut améliorer la précision et la performance des modèles, en particulier lorsque l'ensemble de données d'origine est petit ou manque de diversité. En créant plus d'exemples de formation, l'augmentation des données donne au modèle plus d'opportunités d'apprendre les modèles sous-jacents dans les données. Enfin, elle peut améliorer la robustesse d'un modèle, en le rendant plus résistant aux changements dans les données d'entrée, tels que les variations d'éclairage, d'orientation ou de bruit de fond.

Techniques courantes d'augmentation des données

Plusieurs techniques courantes sont utilisées pour l'augmentation des données, en particulier dans les tâches de vision par ordinateur :

  • Transformations géométriques: Elles comprennent des opérations telles que la rotation, la translation, la mise à l'échelle, le cisaillement et le retournement. Par exemple, faire pivoter une image de quelques degrés ou la retourner horizontalement peut créer de nouveaux exemples de formation valides.
  • Transformations de l'espace couleur: L'ajustement de la luminosité, du contraste, de la saturation ou de la teinte d'une image peut simuler différentes conditions d'éclairage et améliorer la capacité du modèle à se généraliser dans divers environnements.
  • Filtres à noyau: L'application de filtres pour rendre les images plus nettes ou plus floues peut aider le modèle à apprendre des caractéristiques invariantes à ces changements.
  • Effacement aléatoire: Le masquage aléatoire de certaines parties d'une image peut aider le modèle à devenir plus robuste aux occlusions ou aux parties manquantes des objets.
  • Mélange d'images: Les techniques telles que MixUp et CutMix consistent à mélanger des images et leurs étiquettes correspondantes pour créer de nouveaux exemples d'apprentissage. Par exemple, MixUp interpole linéairement les images et leurs étiquettes.

Augmentation des données dans la vision par ordinateur

Dans le domaine de la vision par ordinateur, l'augmentation des données est particulièrement utile car elle permet de simuler un large éventail de scénarios du monde réel qu'un modèle pourrait rencontrer. Par exemple, dans la détection d'objets, un modèle Ultralytics YOLO la première fois que YOLO est mentionné sur une page, formé sur des images augmentées, peut apprendre à détecter des objets indépendamment de leur orientation, de leur taille ou des conditions d'éclairage. Ceci est crucial pour des applications telles que les véhicules autonomes, où le modèle doit fonctionner de manière fiable dans des conditions diverses et imprévisibles. Par exemple, en appliquant diverses transformations telles que la rotation, la mise à l'échelle et l'ajout de bruit aux images de piétons et de véhicules, un système de conduite autonome peut être entraîné à détecter avec précision ces objets dans divers scénarios du monde réel. De même, dans la classification des images, l'ajout de différents ajustements de couleurs peut aider le modèle à mieux s'adapter aux différentes conditions d'éclairage.

Augmentation des données dans d'autres domaines

Si l'augmentation des données est largement utilisée dans le domaine de la vision par ordinateur, elle s'applique également à d'autres domaines tels que le traitement du langage naturel (NLP) et le traitement audio. Dans le traitement du langage naturel, des techniques telles que le remplacement des synonymes, la rétro-traduction et l'insertion/suppression aléatoire de mots peuvent augmenter les données textuelles. Dans le traitement audio, l'ajout de bruits de fond, la modification de la hauteur du son ou l'étirement temporel de l'audio peuvent créer des exemples d'entraînement diversifiés.

Applications dans le monde réel

  • Santé: Dans l'analyse d'images médicales, l'augmentation des données peut être utilisée pour former des modèles sur un nombre limité d'images médicales. Par exemple, en appliquant des rotations, des retournements et de petites déformations aux examens IRM, un modèle peut apprendre à détecter des anomalies avec plus de précision sur différents patients et conditions d'imagerie.
  • Agriculture: L'augmentation des données peut aider à former des modèles pour détecter les maladies ou les parasites des plantes à partir d'images prises dans différentes conditions. En augmentant les images des cultures avec différents éclairages, angles et niveaux de zoom, les modèles peuvent avoir des performances robustes sur le terrain, aidant ainsi les agriculteurs à identifier rapidement les problèmes et à prendre des mesures correctives.

Augmentation des données par rapport à d'autres techniques

Il est important de distinguer l'augmentation des données des autres techniques apparentées :

  • Prétraitement des données: Bien que l'augmentation des données et le prétraitement des données préparent tous deux les données pour l'entraînement au modèle, le prétraitement implique généralement des étapes telles que la normalisation, la standardisation et le traitement des valeurs manquantes. Ces étapes sont essentielles pour s'assurer que les données sont dans un format adapté au modèle. L'augmentation des données, quant à elle, se concentre sur l'accroissement de la diversité des données d'entraînement.
  • Génération de données synthétiques: Les données synthétiques consistent à créer des points de données entièrement nouveaux, souvent à l'aide de modèles génératifs tels que les réseaux adversoriels génératifs (GAN). Cela diffère de l'augmentation des données, qui modifie les données existantes. Les données synthétiques peuvent être particulièrement utiles lorsque les données réelles sont rares ou sensibles, comme dans les applications médicales ou financières.

Outils et bibliothèques

Plusieurs outils et bibliothèques prennent en charge l'augmentation des données. Sur Python, des bibliothèques comme OpenCV et TensorFlow offrent un large éventail de fonctions pour les transformations d'images. En outre, des bibliothèques spécialisées comme Albumentations offrent des pipelines d'augmentation très optimisés et diversifiés. Ultralytics HUB fournit également des outils pour l'augmentation des données, ce qui facilite l'intégration de ces techniques dans le processus de formation des modèles. Explore les techniques d'augmentation des données telles que MixUp, Mosaic et Random Perspective pour améliorer la formation des modèles.

Tout lire