Apprends à utiliser les Albumentations pour les augmentations lors de l'entraînement personnalisé d'Ultralytics YOLO11 afin d'améliorer les performances du modèle avec diverses données d'entraînement.
Lors de l'élaboration d'une solution de vision par ordinateur, la collecte d'un ensemble diversifié d'images pour l'entraînement des modèles d'IA de vision peut constituer une partie cruciale du processus. Cela demande souvent beaucoup de temps et d'argent, et parfois, les images collectées ne sont toujours pas assez variées pour que les modèles apprennent efficacement.
Par exemple, les modèles de vision par ordinateur comme Ultralytics YOLO11 peuvent être entraînés sur mesure sur des ensembles de données d'images pour diverses tâches de vision par ordinateur liées à différentes applications. La diversité des données est essentielle car elle aide le modèle à mieux se généraliser, ce qui lui permet de reconnaître des objets et des motifs dans un large éventail de scénarios du monde réel.
Si tu es confronté à un manque de données diversifiées, les techniques d'augmentation des données d'image peuvent être une excellente solution. Des méthodes telles que la rotation, le retournement et l'ajustement de la luminosité peuvent aider à augmenter la variété de ton ensemble de données, améliorant ainsi la capacité du modèle à gérer un plus large éventail de conditions.
C'est pourquoi Ultralytics prend en charge une intégration pour l'augmentation des données d'images. En utilisant Albumentations, un outil populaire qui propose une collection de transformations, tu peux créer diverses données visuelles. Cette intégration simplifie le processus de formation de YOLO11 en augmentant automatiquement les images de formation, ce qui permet d'améliorer les performances du modèle.
Dans cet article, nous allons explorer comment tu peux utiliser l'intégration d'Albumentations, ses avantages et son impact sur la formation des modèles.
Les modèles de vision par ordinateur peuvent apprendre à partir d'un large ensemble d'images de haute qualité pour reconnaître des objets dans différents environnements. La collecte de grands ensembles de données à partir de sources réelles peut être lente, coûteuse et inefficace. Pour rationaliser cette tâche, tu peux utiliser l'augmentation des données d'images pour créer de nouvelles variations d'images existantes, ce qui permet aux modèles d'apprendre à partir de différents scénarios sans avoir à collecter davantage de données.
Plus précisément, tu peux tirer parti d'Albumentations, une bibliothèque open-source introduite pour une augmentation efficace des données d'image en 2018. Elle prend en charge une variété d'opérations, des simples changements géométriques comme les rotations et les retournements aux ajustements plus complexes comme la luminosité, le contraste et l'ajout de bruit.
Albumentations est connu pour ses hautes performances, ce qui signifie qu'il peut traiter les images rapidement et efficacement. Construit sur des bibliothèques optimisées comme OpenCV et NumPy, il traite de grands ensembles de données avec un temps de traitement minimal, ce qui le rend idéal pour l'augmentation rapide des données pendant la formation des modèles.
Voici d'autres caractéristiques clés des Albumentations :
Tu te poses peut-être la question : il existe de nombreuses façons d'appliquer des augmentations à un ensemble de données, et tu pourrais même créer les tiennes à l'aide d'outils comme OpenCV. Alors, pourquoi choisir une intégration qui prend en charge une bibliothèque comme Albumentations ?
La création manuelle d'augmentations avec des outils comme OpenCV peut prendre beaucoup de temps et nécessite une certaine expertise. Il peut également être délicat d'affiner les transformations pour obtenir les meilleurs résultats. L'intégration d'Albumentations facilite ce processus. Elle propose de nombreuses transformations prêtes à l'emploi qui peuvent te faire gagner du temps et des efforts lors de la préparation de ton jeu de données.
Une autre raison de choisir l'intégration d'Albumentations est qu'elle fonctionne parfaitement avec le pipeline deformation de modèles Ultralytics . Elle facilite grandement la formation personnalisée de YOLO11, car les augmentations sont automatiquement appliquées pendant la formation. Cela simplifie le processus, ce qui te permet de te concentrer davantage sur l'amélioration de ton modèle plutôt que sur la gestion de la préparation des données.
Il est intéressant de noter que l'utilisation des intégrations d'Albumentations pour entraîner YOLO11 est plus simple qu'il n'y paraît. Une fois que les bonnes bibliothèques sont configurées, l'intégration applique automatiquement des augmentations de données d'image pendant l'entraînement. Elle aide le modèle à apprendre à partir de différentes variations d'images en utilisant le même ensemble de données.
Ensuite, voyons comment installer et utiliser l'intégration Albumentations lors de la formation personnalisée de YOLO11.
Avant d'appliquer des augmentations, il faut installer à la fois le paquetageUltralytics Python et Albumentations. L'intégration a été conçue de manière à ce que les deux bibliothèques fonctionnent ensemble de manière transparente par défaut, tu n'as donc pas besoin de te préoccuper de configurations complexes.
L'ensemble du processus d'installation peut être réalisé en quelques minutes à l'aide d'une simple commande pip, qui est un outil de gestion de paquets pour l'installation de bibliothèques Python , comme le montre l'image ci-dessous.
Une fois Albumentations installé, le mode d'entraînement du modèle Ultralytics applique automatiquement des augmentations d'images pendant l'entraînement. Si Albumentations n'est pas installé, ces augmentations ne seront pas appliquées. Pour plus de détails, tu peux te référer à la documentation officielle d'Ultralytics .
Comprenons mieux ce qui se passe sous le capot de l'intégration d'Albumentations.
Voici un examen plus approfondi des augmentations appliquées pendant l'entraînement à YOLO11 :
Si tu entraînes YOLO11 sur mesure pour une application spécifique, l'intégration d'Albumentations peut aider à améliorer les performances du modèle en s'adaptant à diverses conditions. Discutons de quelques applications réelles et des défis que cette intégration peut résoudre.
L'IA de vision dans le domaine de la santé aide les médecins à analyser les images médicales avec plus de précision pour faciliter les diagnostics et améliorer les soins aux patients. En fait, environ un cinquième des organismes de santé utilisent déjà des solutions d'IA.
Cependant, la création de ces solutions de vision par ordinateur s'accompagne de son propre lot de défis. Les scanners médicaux peuvent varier considérablement d'un hôpital à l'autre, influencés par des facteurs tels que les différents équipements, les réglages et même l'expérience des techniciens. Les variations de luminosité, de contraste et d'exposition peuvent affecter la cohérence et la précision des modèles de Vision AI, ce qui les empêche de fonctionner de manière fiable dans différents environnements.
C'est là que l'intégration d'outils comme Albumentations devient essentielle. En générant plusieurs versions augmentées du même scan, Albumentations permet au modèle d'apprendre à partir d'une variété de qualités d'images. Le modèle devient ainsi plus robuste, ce qui lui permet de détecter les maladies avec précision sur des images de haute et de basse qualité.
Une autre application intéressante de l'IA de vision concerne la sécurité et la surveillance. La détection d'objets en temps réel peut aider les équipes de sécurité à identifier rapidement les menaces potentielles.
L'une des principales préoccupations liées à cette application est que les caméras de sécurité enregistrent des séquences dans diverses conditions d'éclairage tout au long de la journée, et ces conditions peuvent affecter considérablement la façon dont un modèle comprend de telles images. Des facteurs tels que les environnements peu éclairés, l'éblouissement ou une mauvaise visibilité peuvent empêcher les modèles de vision par ordinateur de détecter des objets ou de reconnaître des menaces potentielles de manière cohérente.
L'intégration d'Albumentations permet d'appliquer des transformations pour imiter différentes conditions d'éclairage. Cela permet au modèle d'apprendre à détecter des objets dans des environnements lumineux et peu éclairés, ce qui le rend plus fiable et améliore les temps de réponse dans des conditions difficiles.
Un déversement dans une allée de supermarché, un chien qui court dans un magasin ou un enfant qui renverse un présentoir de produits ne sont que quelques exemples d'événements quotidiens qui peuvent constituer des cas limites pour l'IA de vision dans les environnements de vente au détail . La vision par ordinateur est de plus en plus utilisée pour améliorer l'expérience client en suivant le comportement des acheteurs, en surveillant le trafic piétonnier et en identifiant les produits dans les rayons. Cependant, ces situations du monde réel peuvent être difficiles à comprendre et à traiter avec précision pour les systèmes d'IA.
Bien que tous les scénarios ne puissent pas être représentés dans un ensemble de données de vision par ordinateur, l'intégration d'Albumentations aide en augmentant les données pour couvrir de nombreuses situations possibles, telles qu'un éclairage inattendu, des angles inhabituels ou des obstructions. Cela aide les modèles de vision par ordinateur à s'adapter à diverses conditions, améliorant ainsi leur capacité à gérer les cas limites et à faire des prédictions précises dans les environnements de vente au détail dynamiques.
La collecte de diverses données du monde réel pour l'entraînement des modèles peut être compliquée, mais Albumentations facilite les choses en créant des variations d'images qui aident les modèles à s'adapter à différentes conditions.
L'intégration d'Albumentations prise en charge par Ultralytics simplifie le processus d'application de ces augmentations tout en formant YOLO11 sur mesure. Il en résulte une meilleure qualité des ensembles de données, qui profite à un large éventail d'industries en produisant des modèles d'IA Vision plus précis et plus fiables.
Rejoins notre communauté et explore notre dépôt GitHub pour en savoir plus sur l'IA, et consulte nos options de licence pour donner un coup de fouet à tes projets Vision AI. Tu es intéressé par des innovations telles que l 'IA dans la fabrication ou la vision par ordinateur dans la conduite autonome? Visite nos pages de solutions pour en découvrir davantage.
Commence ton voyage avec le futur de l'apprentissage automatique.