Contrôle vert
Lien copié dans le presse-papiers

Entraînement personnalisé Ultralytics YOLO11 avec des ensembles de données de vision par ordinateur

Découvre comment l'intégration de Roboflow peut simplifier la formation personnalisée Ultralytics YOLO11 en rendant les ensembles de données de vision par ordinateur open-source facilement accessibles.

L'entraînement d'un modèle de vision par ordinateur comme Ultralytics YOLO11 implique généralement de collecter des images pour ton ensemble de données, de les annoter, de préparer les données et d'affiner le modèle pour qu'il réponde à tes besoins spécifiques. Bien que le progicielUltralytics Python rende ces étapes simples et conviviales, le développement de Vision AI peut encore prendre beaucoup de temps.

Cela devient particulièrement vrai lorsque tu travailles dans un délai serré ou que tu développes un prototype. Dans ces situations, disposer d'outils ou d'intégrations qui simplifient certaines parties du processus - comme la rationalisation de la préparation des jeux de données ou l'automatisation des tâches répétitives - peut faire une grande différence. En réduisant le temps et les efforts nécessaires, ces solutions t'aident à te concentrer sur la construction et le perfectionnement de ton modèle. C'est exactement ce qu'offre l'intégration de Roboflow .

L'intégration Roboflow te permet d'accéder facilement aux ensembles de données de Roboflow Universe, une grande bibliothèque d'ensembles de données de vision par ordinateur à source ouverte. Au lieu de passer des heures à collecter et à organiser des données, tu peux rapidement trouver et utiliser des ensembles de données existants pour lancer ton processus de formation sur YOLO11 . Grâce à cette intégration, il est beaucoup plus rapide et plus simple d'expérimenter et d'itérer sur le développement de tes modèles de vision par ordinateur.

Dans cet article, nous allons voir comment tu peux tirer parti de l'intégration de Roboflow pour accélérer le développement des modèles. C'est parti !

Qu'est-ce que Roboflow Universe ?

Roboflow Universe est une plateforme gérée par Roboflow, une société dont l'objectif est de simplifier le développement de la vision par ordinateur. Elle comprend plus de 350 millions d'images, 500 000 ensembles de données et 100 000 modèles affinés pour des tâches telles que la détection d'objets, la classification d'images et la segmentation. Avec les contributions de développeurs et de chercheurs du monde entier, Roboflow Universe est un centre de collaboration pour tous ceux qui cherchent à démarrer ou à améliorer leurs projets de vision par ordinateur.

Fig 1. Exemples d'ensembles de données de détection d'objets sur Roboflow Universe.

Roboflow Universe comprend les caractéristiques clés suivantes :

  • Outils d'exploration des ensembles de données: Explore, filtre et visualise les ensembles de données pour trouver rapidement les ressources qui correspondent aux exigences de ton projet.
  • Options d'exportation: Exporte les données dans des formats tels que COCO, YOLO, TFRecord, CSV, et bien d'autres encore, afin de les adapter à ton flux de travail.
  • Analyse des ensembles de données: Obtenir des informations sur divers ensembles de données grâce à des outils d'analyse qui fournissent des visualisations des distributions d'étiquettes, des déséquilibres entre les classes et de la qualité des ensembles de données. 
  • Suivi des versions: Visualise et accède aux différentes versions des jeux de données téléchargés par les contributeurs, ce qui te permet de suivre les mises à jour, de comparer les modifications et de choisir la version qui correspond le mieux aux besoins de ton projet. 

L'intégration de Roboflow t'aide à trouver les bonnes données.

Trouver le bon ensemble de données est souvent l'une des parties les plus difficiles de la construction d'un modèle de vision par ordinateur. La création d'un ensemble de données implique généralement de rassembler de grandes quantités d'images, de s'assurer qu'elles sont pertinentes pour ta tâche, puis de les étiqueter avec précision. 

Ce processus peut prendre beaucoup de temps et de ressources, surtout si tu expérimentes différentes approches sur une courte période. Même trouver des ensembles de données préexistants peut s'avérer délicat, car ils sont souvent dispersés sur différentes plateformes, ne sont pas documentés correctement ou ne comportent pas les annotations spécifiques dont tu as besoin.

Par exemple, si tu construis une application de vision artificielle pour détecter les mauvaises herbes dans les champs agricoles, tu voudras peut-être tester différentes approches de Vision AI, comme la détection d'objets par rapport à la segmentation d'instances. Cela te permet d'expérimenter et de comprendre quelle méthode fonctionne le mieux avant de consacrer du temps et des efforts à la collecte et à l'étiquetage de ton propre ensemble de données.

Fig 2. Détection des pièces de voiture à l'aide de YOLO11.

En utilisant l'intégration Roboflow , tu peux parcourir une variété d'ensembles de données liés à l'agriculture, y compris ceux qui sont axés sur la détection des mauvaises herbes, la santé des cultures ou la surveillance des champs. Ces ensembles de données prêts à l'emploi te permettent d'essayer différentes techniques et d'affiner ton modèle sans l'effort initial de création de tes propres données. 

Comment fonctionne l'intégration de Roboflow

Maintenant que nous avons discuté de la façon dont tu peux utiliser l'intégration Roboflow pour trouver les bons ensembles de données, voyons comment elle s'intègre dans ton flux de travail. Une fois que tu as choisi un ensemble de données dans Roboflow Universe, tu peux l'exporter ou le télécharger au format YOLO11 . Une fois ton jeu de données exporté, tu peux l'utiliser pour former YOLO11 à l'aide du paquet Ultralytics Python . 

En téléchargeant ton jeu de données, tu remarqueras peut-être que Roboflow Universe prend en charge d'autres formats pour l'entraînement de différents modèles. Alors, pourquoi devrais-tu choisir d'entraîner sur mesure Ultralytics YOLO11 ? 

YOLO11 est la dernière version des modèles Ultralytics YOLO et est conçu pour offrir une détection d'objets plus rapide et plus précise. Il utilise 22 % de paramètres en moins (les valeurs internes qu'un modèle ajuste pendant la formation pour faire des prédictions) que YOLOv8m, tout en obtenant une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO. Cet équilibre entre vitesse et précision fait de YOLO11 un choix polyvalent pour une large gamme d'applications de vision par ordinateur, en particulier lors de l'entraînement personnalisé des modèles pour répondre à des tâches spécifiques.

Voici un examen plus approfondi du fonctionnement de la formation personnalisée YOLO11:

  • Alimentation des données: Le modèle YOLO11 traite ton ensemble de données, en apprenant à détecter et à classer les objets à partir des images et de leurs annotations.
  • Prédiction et retour d'information: Le modèle fait des prédictions sur les objets des images et les compare aux bonnes réponses fournies dans l'ensemble de données.
  • Suivi des performances: Des mesures telles que la précision (détections correctes), le rappel (détections manquées) et la perte (erreurs de prédiction) sont suivies pour évaluer les progrès.
  • Apprentissage itératif: Le modèle ajuste ses paramètres au cours de plusieurs cycles (époques) pour améliorer la précision de la détection et minimiser les erreurs.
  • Sortie du modèle final: Après l'entraînement, le modèle optimisé est sauvegardé et prêt à être déployé.

Autres intégrations axées sur le développement de la vision par ordinateur

En explorant l'intégration Roboflow , tu remarqueras d'autres intégrations mentionnées dans la documentationUltralytics . Nous prenons en charge une variété d'intégrations liées à diverses étapes du développement de la vision par ordinateur. 

Il s'agit de fournir à notre communauté une gamme d'options, afin que tu puisses choisir ce qui fonctionne le mieux pour ton flux de travail spécifique.

Fig 3. Vue d'ensemble des intégrations prises en charge par Ultralytics.

En plus des ensembles de données, d'autres intégrations prises en charge par Ultralytics se concentrent sur diverses parties du processus de vision par ordinateur, telles que la formation, le déploiement et l'optimisation. Voici quelques exemples d'autres intégrations que nous prenons en charge :

  • Intégrations de formation : Des intégrations comme Amazon SageMaker et Paperspace Gradient rationalisent les flux de travail de formation en offrant des plateformes basées sur le cloud pour un développement et des tests de modèles efficaces.
  • Intégrations de flux de travail et de suivi des expériences : ClearML, MLFlow et Weights & Biases (W&B) permettent d'automatiser les flux de travail, de suivre les expériences et d'améliorer la collaboration, ce qui facilite la gestion des projets d'apprentissage automatique.
  • Optimisation et intégrations de déploiement : CoreML, ONNX, et OpenVINO permettent un déploiement optimisé sur divers appareils et cadres, garantissant des performances efficaces sur des plates-formes telles que le matériel Apple et Intel CPU.
  • Intégrations de suivi et de visualisation : TensorBoard et Weights & Biases fournissent des outils pour visualiser la progression de l'entraînement et surveiller les performances, ce qui permet d'obtenir des informations détaillées pour affiner les modèles.

YOLO11 les applications et le rôle des intégrations

Les intégrations qui soutiennent le développement de la vision par ordinateur, combinées aux capacités fiables de YOLO11, facilitent la résolution des défis du monde réel. Considère des innovations comme la vision par ordinateur dans la fabrication, où l'IA de vision est utilisée pour détecter des défauts sur une chaîne de production - comme des rayures sur des pièces métalliques ou des composants manquants. La collecte des bonnes données pour de telles tâches peut souvent être lente et difficile, nécessitant l'accès à des environnements spécialisés. 

Elle consiste généralement à installer des caméras ou des capteurs le long des lignes de production pour capturer des images des produits. Ces images doivent être prises en grande quantité, souvent sous un éclairage et des angles constants, afin de garantir leur clarté et leur uniformité. 

Une fois capturées, les images doivent être méticuleusement annotées avec des étiquettes précises pour chaque type de défaut, comme les rayures, les bosses ou les composants manquants. Ce processus nécessite beaucoup de temps et de ressources, ainsi que de l'expertise, pour s'assurer que l'ensemble de données reflète fidèlement la variabilité du monde réel. Des facteurs tels que les différentes tailles, formes et matériaux des défauts doivent être pris en compte pour créer un ensemble de données robuste et fiable.

Les intégrations qui fournissent des ensembles de données prêts à l'emploi facilitent des tâches telles que le contrôle de la qualité industrielle, et grâce aux capacités de détection en temps réel de YOLO11, les fabricants peuvent surveiller les chaînes de production, repérer instantanément les défauts et améliorer l'efficacité.

Fig 4. Exemple d'utilisation d'Ultraytics YOLO11 pour détecter et compter les boîtes de conserve en cours de fabrication.

Au-delà de la fabrication, les intégrations liées aux ensembles de données peuvent être utilisées dans de nombreuses autres industries. En associant la vitesse et la précision de YOLO11à des ensembles de données facilement accessibles, les entreprises peuvent rapidement développer et déployer des solutions adaptées à leurs besoins spécifiques. Prenons l'exemple des soins de santé - les intégrations d'ensembles de données peuvent aider à développer des solutions pour analyser les images médicales afin de détecter des anomalies comme les tumeurs. De même, dans la conduite autonome, ces intégrations peuvent aider à identifier les véhicules, les piétons et les panneaux de signalisation pour améliorer la sécurité.

Principaux enseignements

Trouver le bon ensemble de données est souvent l'une des parties les plus fastidieuses de la construction d'un modèle de vision par ordinateur. Cependant, l'intégration de Roboflow permet de trouver plus facilement le meilleur ensemble de données pour l'entraînement personnalisé de tes modèles Ultralytics YOLO , même si tu es novice en matière de vision par ordinateur. 

Avec l'accès à une vaste collection d'ensembles de données pour les tâches de vision par ordinateur comme la détection d'objets, la classification d'images ou la segmentation d'instances, Roboflow Universe te débarrasse des tracas du processus de découverte de données. Il t'aide à démarrer rapidement et à te concentrer sur la construction de ton modèle plutôt que de passer du temps à collecter et à organiser les données. Cette approche rationalisée permet aux développeurs de prototyper, d'itérer et de développer des solutions de vision par ordinateur plus efficacement.

Pour en savoir plus, visite notre dépôt GitHub et engage-toi auprès de notre communauté. Explore les innovations dans des domaines tels que l 'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture sur nos pages de solutions. 🚀

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.