Contrôle vert
Lien copié dans le presse-papiers

L'importance des ensembles de données de vision par ordinateur de haute qualité

Rejoins-nous pour explorer la nécessité de disposer de données de haute qualité lors de la construction de modèles de vision par ordinateur. Découvre comment la qualité des données peut avoir un impact sur les performances du modèle.

En 2019, l'adoption de l'intelligence artificielle (IA) par les entreprises avait augmenté de 270 % au cours des quatre années précédentes. Cette croissance a alimenté l'intégration rapide des applications de vision par ordinateur (VA) - des systèmes d'IA qui permettent aux machines d'interpréter et d'analyser les données visuelles du monde qui les entoure. Ces applications alimentent un large éventail de technologies, allant de la détection de maladies dans l'imagerie médicale et de l'activation de véhicules autonomes à l'optimisation de la circulation dans les transports et à l'amélioration de la surveillance dans les systèmes de sécurité. 

La précision remarquable et les performances inégalées des modèles de vision par ordinateur de pointe tels que Ultralytics YOLO11 ont largement contribué à cette croissance exponentielle. Cependant, les performances de ces modèles dépendent fortement de la qualité et de la quantité des données utilisées pour former, valider et tester les modèles. 

Sans suffisamment de données de haute qualité, les modèles de vision par ordinateur peuvent être difficiles à former et à affiner efficacement pour répondre aux normes de l'industrie. Dans cet article, nous allons explorer le rôle vital des données dans la création de modèles de vision par ordinateur et pourquoi les données de haute qualité sont si importantes dans la vision par ordinateur. Nous allons également passer en revue quelques conseils pour t'aider à créer des ensembles de données de haute qualité lorsque tu travailles sur la formation de modèles de vision par ordinateur personnalisés. C'est parti !

Le rôle des données dans la construction de modèles de vision par ordinateur

Les modèles de vision par ordinateur peuvent être entraînés sur de grands ensembles de données d' images et de vidéos pour reconnaître des modèles et faire des prédictions précises. Par exemple, un modèle de détection d'objets peut être entraîné sur des centaines, voire des milliers, d'images et de vidéos étiquetées afin d'identifier les objets avec précision. 

La qualité et la quantité de ces données d'entraînement influencent les performances du modèle

Étant donné que les modèles de vision par ordinateur ne peuvent apprendre qu'à partir des données auxquelles ils sont exposés, la fourniture de données de haute qualité et d'exemples diversifiés est cruciale pour leur réussite. Sans ensembles de données suffisants et diversifiés, ces modèles risquent de ne pas analyser correctement les scénarios du monde réel et pourraient produire des résultats biaisés ou inexacts. 

C'est pourquoi il est important de bien comprendre le rôle des données dans la formation des modèles . Avant de parcourir les caractéristiques des données de haute qualité, comprenons les types d'ensembles de données que tu peux rencontrer lors de la formation des modèles de vision par ordinateur.

Types d'ensembles de données de vision par ordinateur

Dans le domaine de la vision par ordinateur, les données utilisées dans le processus de formation sont classées en trois catégories, chacune ayant un but précis. Voici un aperçu rapide de chaque type :

  • Données de formation: Il s'agit de l'ensemble de données principal utilisé pour former le modèle à partir de zéro. Il se compose d'images et de vidéos avec des étiquettes prédéfinies, permettant au modèle d'apprendre des modèles et de reconnaître des objets. 
  • Données de validation: Il s'agit d'un ensemble de données utilisé pour vérifier les performances d'un modèle pendant sa formation. Il permet de s'assurer que le modèle fonctionne correctement sur de nouvelles données inédites.
  • Données de test: Un ensemble distinct de données utilisé pour évaluer les performances finales d'un modèle formé. Il vérifie dans quelle mesure le modèle peut faire des prédictions sur des données complètement nouvelles et inédites.
Fig 1. Comment les données sont classées dans la vision par ordinateur.

Les 5 principales caractéristiques des ensembles de données de vision par ordinateur de haute qualité

Quel que soit le type de jeu de données, des données de haute qualité sont essentielles pour construire des modèles de vision par ordinateur performants. Voici quelques-unes des principales caractéristiques qui font qu'un ensemble de données est de haute qualité :

  • Précision: Dans l'idéal, les données doivent refléter étroitement les situations du monde réel et inclure des étiquettes correctes. Par exemple, lorsqu'il s'agit de Vision AI dans le domaine de la santé, les images de radiographies ou de scanners doivent être étiquetées avec précision pour aider le modèle à apprendre correctement. 
  • Diversité: Un bon ensemble de données comprend une variété d'exemples pour aider le modèle à être performant dans différentes situations. Par exemple, si un modèle apprend à détecter des voitures, l'ensemble de données doit inclure des voitures de différentes formes, tailles et couleurs dans différents contextes (jour, nuit, pluie, etc.).
  • Cohérence: Les ensembles de données de haute qualité suivent un format uniforme et des normes de qualité. Par exemple, les images doivent avoir des résolutions similaires (pas certaines floues et d'autres nettes) et passer par les mêmes étapes de prétraitement, comme le redimensionnement ou l'ajustement des couleurs, afin que le modèle apprenne à partir d'informations cohérentes.
  • Actualité: Les ensembles de données qui sont mis à jour régulièrement peuvent suivre les changements du monde réel. Disons que tu entraînes un modèle à détecter tous les types de véhicules. Si de nouveaux types de véhicules, comme les scooters électriques, sont introduits, ils doivent être ajoutés à l'ensemble de données pour s'assurer que le modèle reste précis et à jour.
  • Vie privée: Si un ensemble de données comprend des informations sensibles, comme des photos de personnes, il doit respecter les règles de confidentialité. Des techniques comme l'anonymisation (suppression des détails identifiables) et le masquage des données (dissimulation des parties sensibles) peuvent protéger la vie privée tout en permettant d'utiliser les données en toute sécurité.

Défis posés par des données de mauvaise qualité

S'il est important de comprendre les caractéristiques des données de haute qualité, il est tout aussi vital de prendre en compte la façon dont les données de mauvaise qualité peuvent affecter tes modèles de vision par ordinateur.

Des problèmes tels que l'ajustement excessif et l'ajustement insuffisant peuvent avoir un impact important sur les performances du modèle. Il y a surajustement lorsqu'un modèle donne de bons résultats avec les données d'entraînement, mais qu'il a du mal avec les données nouvelles ou inédites, souvent parce que l'ensemble de données n'est pas assez varié. Le sous-ajustement, quant à lui, se produit lorsque l'ensemble de données ne fournit pas suffisamment d'exemples ou de qualité pour que le modèle puisse apprendre des modèles significatifs. Pour éviter ces problèmes, il est essentiel de conserver des ensembles de données diversifiés, impartiaux et de haute qualité, afin de garantir des performances fiables à la fois pour la formation et pour les applications réelles.

Fig 2. Sous-adaptation Vs. Surajustement.

Les données de faible qualité peuvent également rendre difficile l'extraction et l'apprentissage de modèles significatifs à partir des données brutes, un processus connu sous le nom d'extraction de caractéristiques. Si l'ensemble de données est incomplet, non pertinent ou manque de diversité, le modèle peut avoir du mal à fonctionner efficacement. 

Parfois, des données de mauvaise qualité peuvent être le résultat d'une simplification des données. La simplification des données peut aider à économiser de l'espace de stockage et à réduire les coûts de traitement, mais une simplification excessive peut supprimer des détails importants dont le modèle a besoin pour bien fonctionner. C'est pourquoi il est si important de conserver des données de haute qualité tout au long du processus de vision par ordinateur, de la collecte au déploiement. En règle générale, les ensembles de données doivent inclure des caractéristiques essentielles tout en restant diversifiés et précis pour garantir la fiabilité des prédictions du modèle.

Fig 3. Comprendre l'extraction des caractéristiques.

Conseils pour maintenir la qualité de ton jeu de données de vision par ordinateur

Maintenant que nous avons compris l'importance des données de haute qualité et l'impact des données de mauvaise qualité, explorons comment faire en sorte que ton jeu de données réponde à des normes élevées.

Tout commence par une collecte de données fiable. L'utilisation de sources diverses telles que le crowdsourcing, les données provenant de régions géographiques variées et la génération de données synthétiques permet de réduire les biais et d'aider les modèles à gérer les scénarios du monde réel. Une fois les données collectées, le prétraitement est essentiel. Des techniques comme la normalisation, qui met à l'échelle les valeurs des pixels dans une fourchette cohérente, et l'augmentation, qui applique des transformations comme la rotation, le retournement et le zoom, améliorent l'ensemble de données. Ces étapes aident ton modèle à mieux se généraliser et à devenir plus robuste, réduisant ainsi le risque de surajustement.

Diviser correctement les ensembles de données est une autre étape clé. Une approche courante consiste à affecter 70 % des données à la formation, 15 % à la validation et 15 % aux tests. En vérifiant deux fois qu'il n'y a pas de chevauchement entre ces ensembles, on évite les fuites de données et on garantit une évaluation précise du modèle.

Fig 4. Une répartition commune des données entre la formation, la validation et le test.

Tu peux aussi utiliser des modèles préformés comme YOLO11 pour gagner du temps et économiser des ressources informatiques. YOLO11 Les modèles préformés, formés sur de grands ensembles de données et conçus pour diverses tâches de vision par ordinateur, peuvent être affinés sur ton ensemble de données spécifique pour répondre à tes besoins. En ajustant le modèle à tes données, tu peux éviter le surajustement et maintenir de bonnes performances. 

Le chemin à parcourir pour les ensembles de données de vision par ordinateur

La communauté de l'IA s'est traditionnellement concentrée sur l'amélioration des performances en construisant des modèles plus profonds avec davantage de couches. Cependant, à mesure que l'IA continue d'évoluer, l'accent n'est plus mis sur l'optimisation des modèles, mais sur l'amélioration de la qualité des ensembles de données. Andrew Ng, souvent considéré comme le "père de l'IA", estime que "le changement le plus important que le monde de l'IA doit vivre au cours de cette décennie sera le passage à une IA centrée sur les données." 

Cette approche met l'accent sur l'affinage des ensembles de données en améliorant la précision des étiquettes, en supprimant les exemples bruyants et en garantissant la diversité. Dans le domaine de la vision artificielle, ces principes sont essentiels pour résoudre des problèmes tels que les biais et les données de mauvaise qualité, et permettre aux modèles de fonctionner de manière fiable dans des scénarios réels.

Si l'on se tourne vers l'avenir, les progrès de la vision par ordinateur reposeront sur la création d'ensembles de données plus petits et de haute qualité plutôt que sur la collecte de grandes quantités de données. Selon Andrew Ng, "l'amélioration des données n'est pas une étape ponctuelle de prétraitement ; c'est une partie essentielle du processus itératif de développement de modèles d'apprentissage automatique." En se concentrant sur des principes centrés sur les données, la vision par ordinateur continuera à devenir plus accessible, plus efficace et plus impactante dans diverses industries.

Principaux enseignements

Les données jouent un rôle essentiel tout au long du cycle de vie d'un modèle de vision. De la collecte des données au prétraitement, en passant par l'entraînement, la validation et les tests, la qualité des données a un impact direct sur les performances et la fiabilité du modèle. En donnant la priorité à des données de haute qualité et à un étiquetage précis, nous pouvons construire des modèles de vision par ordinateur robustes qui fournissent des résultats fiables et précis. 

Alors que nous nous dirigeons vers un avenir axé sur les données, il est essentiel d'aborder les considérations éthiques afin d'atténuer les risques liés aux préjugés et aux réglementations en matière de protection de la vie privée. En fin de compte, il est essentiel de garantir l'intégrité et l'équité des données pour libérer tout le potentiel des technologies de vision par ordinateur.

Rejoins notre communauté et consulte notre dépôt GitHub pour en savoir plus sur l'IA. Consulte nos pages de solutions pour explorer davantage d'applications de l'IA dans des secteurs comme l'agriculture et la fabrication.

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.