Améliore tes modèles d'apprentissage automatique grâce à l'augmentation des données. Découvre des techniques pour booster la précision, réduire l'overfitting et améliorer la robustesse.
L'augmentation des données est une technique utilisée en apprentissage automatique pour augmenter artificiellement la taille d'un ensemble de données de formation en créant des versions modifiées de données existantes. Ce processus consiste à appliquer diverses transformations aux données d'origine, telles que la rotation, le retournement, la mise à l'échelle ou le recadrage des images. En augmentant la diversité des données de formation, l'augmentation des données permet d'améliorer la capacité de généralisation des modèles d'apprentissage automatique, ce qui les rend plus robustes et moins sujets à l'overfitting. L'ajustement excessif se produit lorsqu'un modèle apprend trop bien les données d'entraînement, y compris le bruit et les valeurs aberrantes, ce qui peut entraîner de mauvaises performances sur de nouvelles données inédites.
L'augmentation des données offre plusieurs avantages clés. Tout d'abord, elle permet de réduire le surajustement en exposant le modèle à un plus grand nombre de variations au cours de la formation. Cela rend le modèle moins sensible aux caractéristiques spécifiques des données d'apprentissage et plus apte à se généraliser à de nouvelles données inédites. Deuxièmement, cela peut améliorer la précision et la performance des modèles, en particulier lorsque l'ensemble de données d'origine est petit ou manque de diversité. En créant plus d'exemples de formation, l'augmentation des données donne au modèle plus d'opportunités d'apprendre les modèles sous-jacents dans les données. Enfin, elle peut améliorer la robustesse d'un modèle, en le rendant plus résistant aux changements dans les données d'entrée, tels que les variations d'éclairage, d'orientation ou de bruit de fond.
Plusieurs techniques courantes sont utilisées pour l'augmentation des données, en particulier dans les tâches de vision par ordinateur :
Dans le domaine de la vision par ordinateur, l'augmentation des données est particulièrement utile car elle permet de simuler un large éventail de scénarios du monde réel qu'un modèle pourrait rencontrer. Par exemple, dans la détection d'objets, un modèle Ultralytics YOLO la première fois que YOLO est mentionné sur une page, formé sur des images augmentées, peut apprendre à détecter des objets indépendamment de leur orientation, de leur taille ou des conditions d'éclairage. Ceci est crucial pour des applications telles que les véhicules autonomes, où le modèle doit fonctionner de manière fiable dans des conditions diverses et imprévisibles. Par exemple, en appliquant diverses transformations telles que la rotation, la mise à l'échelle et l'ajout de bruit aux images de piétons et de véhicules, un système de conduite autonome peut être entraîné à détecter avec précision ces objets dans divers scénarios du monde réel. De même, dans la classification des images, l'ajout de différents ajustements de couleurs peut aider le modèle à mieux s'adapter aux différentes conditions d'éclairage.
Si l'augmentation des données est largement utilisée dans le domaine de la vision par ordinateur, elle s'applique également à d'autres domaines tels que le traitement du langage naturel (NLP) et le traitement audio. Dans le traitement du langage naturel, des techniques telles que le remplacement des synonymes, la rétro-traduction et l'insertion/suppression aléatoire de mots peuvent augmenter les données textuelles. Dans le traitement audio, l'ajout de bruits de fond, la modification de la hauteur du son ou l'étirement temporel de l'audio peuvent créer des exemples d'entraînement diversifiés.
Il est important de distinguer l'augmentation des données des autres techniques apparentées :
Plusieurs outils et bibliothèques prennent en charge l'augmentation des données. Sur Python, des bibliothèques comme OpenCV et TensorFlow offrent un large éventail de fonctions pour les transformations d'images. En outre, des bibliothèques spécialisées comme Albumentations offrent des pipelines d'augmentation très optimisés et diversifiés. Ultralytics HUB fournit également des outils pour l'augmentation des données, ce qui facilite l'intégration de ces techniques dans le processus de formation des modèles. Explore les techniques d'augmentation des données telles que MixUp, Mosaic et Random Perspective pour améliorer la formation des modèles.