Compare Ultralytics YOLOv8, YOLOv9, YOLOv10 et Ultralytics YOLO11 pour comprendre comment ces modèles ont évolué et se sont améliorés de 2023 à 2025.
De l'automatisation des tâches quotidiennes à l'aide à la prise de décisions éclairées en temps réel, l'intelligence artificielle (IA) est en train de remodeler l'avenir de diverses industries. Un domaine particulièrement fascinant de l'IA est la vision par ordinateur, autrement appelée Vision AI. Il s'agit de permettre aux machines d'analyser et d'interpréter les données visuelles comme le font les humains.
Plus précisément, les modèles de vision par ordinateur sont à l'origine d'innovations qui améliorent à la fois la sécurité et l'efficacité. Par exemple, ces modèles sont utilisés dans les voitures auto-conduites pour détecter les piétons et dans les caméras de sécurité pour surveiller les locaux 24 heures sur 24.
Certains des modèles de vision par ordinateur les plus connus sont les modèles YOLO (You Only Look Once), réputés pour leurs capacités de détection d'objets en temps réel. Au fil du temps, les modèles YOLO se sont améliorés, chaque nouvelle version offrant de meilleures performances et une plus grande flexibilité.
Des versions plus récentes comme Ultralytics YOLO11 peuvent gérer une variété de tâches, comme la segmentation d'instances, la classification d'images, l'estimation de la pose et le suivi de plusieurs objets, avec une précision, une vitesse et une exactitude jamais atteintes auparavant.
Dans cet article, nous allons comparer Ultralytics YOLOv8YOLOv9, YOLOv10 et Ultralytics YOLO11 pour avoir une meilleure idée de l'évolution de ces modèles. Nous analyserons leurs principales caractéristiques, leurs résultats d'analyse comparative et leurs différences de performance. C'est parti !
YOLOv8, publié par Ultralytics le 10 janvier 2023, constitue une avancée majeure par rapport aux modèles YOLO précédents. Optimisé pour une détection précise en temps réel, il associe des approches éprouvées à des mises à jour innovantes pour de meilleurs résultats.
Au-delà de la détection d'objets, il prend également en charge les tâches de vision par ordinateur suivantes : segmentation d'instances, estimation de la pose, détection d'objets par boîtes de délimitation orientées (OBB) et classification d'images. Une autre caractéristique importante de YOLOv8 est qu'il est disponible en cinq variantes de modèles différents - Nano, Small, Medium, Large et X - afin que tu puisses choisir le bon équilibre entre vitesse et précision en fonction de tes besoins.
Grâce à sa polyvalence et à ses solides performances, YOLOv8 peut être utilisé dans de nombreuses applications du monde réel, comme les systèmes de sécurité, les villes intelligentes, les soins de santé et l'automatisation industrielle.
Voici un examen plus approfondi de quelques-unes des autres caractéristiques clés de YOLOv8:
YOLOv9 a été publié le 21 février 2024 par Chien-Yao Wang et Hong-Yuan Mark Liao de l'Institut des sciences de l'information, Academia Sinica, à Taïwan. Il prend en charge des tâches telles que la détection d'objets et la segmentation d'instances.
Ce modèle s'appuie sur Ultralytics YOLOv5 et introduit deux innovations majeures : L'information programmable de gradient (PGI) et le réseau d'agrégation de couches efficace généralisé (GELAN).
PGI aide YOLOv9 à conserver les informations importantes lorsqu'il traite les données à travers ses couches, ce qui permet d'obtenir des résultats plus précis. Pendant ce temps, GELAN améliore la façon dont le modèle utilise ses couches, ce qui stimule les performances et l'efficacité de calcul. Grâce à ces mises à niveau, YOLOv9 peut gérer des tâches en temps réel sur les appareils périphériques et les applications mobiles, où les ressources informatiques sont souvent limitées.
Voici un aperçu de quelques-unes des autres caractéristiques clés de YOLOv8:
YOLOv10 a été présenté le 23 mai 2024 par des chercheurs de l'université de Tsinghua et se concentre sur la détection d'objets en temps réel. Il s'attaque aux limitations des versions précédentes de YOLO en supprimant la nécessité d'une suppression non maximale (NMS), une étape de post-traitement utilisée pour éliminer les détections en double, et en affinant la conception générale du modèle. Il en résulte une détection plus rapide et plus efficace des objets, tout en conservant une précision de pointe.
Une partie essentielle de ce qui rend cela possible est une approche de formation connue sous le nom d'assignation cohérente de deux étiquettes. Elle combine deux stratégies : l'une qui permet à plusieurs prédictions d'apprendre du même objet (one-to-many) et l'autre qui se concentre sur le choix de la meilleure prédiction unique (one-to-one). Comme les deux stratégies suivent les mêmes règles d'appariement, le modèle apprend de lui-même à éviter les doublons, de sorte que le DDN n'est pas nécessaire.
L'architecture de YOLOv10 utilise également une colonne vertébrale CSPNet améliorée pour apprendre les caractéristiques plus efficacement et un cou PAN (Path Aggregation Network) qui combine les informations provenant de différentes couches, ce qui lui permet de mieux détecter les objets de petite et de grande taille. Ces améliorations permettent d'utiliser YOLOv10 pour des applications réelles dans les domaines de la fabrication, de la vente au détail et de la conduite autonome.
Voici quelques-unes des autres caractéristiques remarquables de YOLOv10 :
Cette année, le 30 septembre, Ultralytics a officiellement lancé YOLO11 - l'un des derniers modèles de la série YOLO - lors de son événement hybride annuel, YOLO Vision 2024 (YV24).
Cette version a introduit des améliorations significatives par rapport aux versions précédentes. YOLO11 est plus rapide, plus précis et très efficace. Il prend en charge l'ensemble des tâches de vision par ordinateur auxquelles les utilisateurs de YOLOv8 sont habitués, notamment la détection d'objets, la segmentation d'instances et la classification d'images. Elle maintient également la compatibilité avec les flux de travail de YOLOv8 , ce qui permet aux utilisateurs de passer facilement à la nouvelle version.
En plus de cela, YOLO11 est conçu pour répondre à un large éventail de besoins informatiques - des appareils légers en périphérie aux puissants systèmes en nuage. Le modèle est disponible en version open-source et en version entreprise, ce qui le rend adaptable à différents cas d'utilisation.
C'est une excellente option pour les tâches de précision comme l'imagerie médicale et la détection de satellites, ainsi que pour des applications plus larges dans les véhicules autonomes, l'agriculture et les soins de santé.
Voici quelques-unes des autres caractéristiques uniques de YOLO11:
Lorsque l'on explore différents modèles, il n'est pas toujours facile de les comparer simplement en regardant leurs caractéristiques. C'est là que l'analyse comparative entre en jeu. En exécutant tous les modèles sur le même ensemble de données, nous pouvons mesurer et comparer objectivement leurs performances. Examinons les performances de chaque modèle sur l'ensemble de données COCO.
Lorsque l'on compare les modèles YOLO , chaque nouvelle version apporte des améliorations notables en matière de précision, de vitesse et de flexibilité. En particulier, YOLO11m fait un bond en avant car il utilise 22 % de paramètres en moins que YOLOv8m, ce qui signifie qu'il est plus léger et plus rapide à exécuter. De plus, malgré sa taille plus petite, il atteint une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO. Cette mesure permet d'évaluer l'efficacité avec laquelle le modèle détecte et localise les objets ; une précision moyenne plus élevée signifie donc que les prédictions sont plus précises.
Explorons les performances de ces modèles dans une situation réelle.
Pour comparer YOLOv8, YOLOv9, YOLOv10 et YOLO11, les quatre ont été exécutés sur la même vidéo de trafic en utilisant un score de confiance de 0,3 (le modèle n'affiche les détections que lorsqu'il est sûr à au moins 30 % d'avoir correctement identifié un objet) et une taille d'image de 640 pour une évaluation équitable. Les résultats de la détection et du suivi des objets ont mis en évidence des différences clés en matière de précision, de vitesse et d'exactitude de la détection.
Dès la première image, YOLO11 a repéré de gros véhicules comme des camions que YOLOv10 n'avait pas détectés. YOLOv8 et YOLOv9 ont montré des performances décentes mais variables en fonction des conditions d'éclairage et de la taille de l'objet. Les véhicules plus petits et plus éloignés sont restés un défi pour tous les modèles, bien que YOLO11 ait montré des améliorations notables dans ces détections également.
En termes de vitesse, tous les modèles ont fonctionné entre 10 et 20 millisecondes par image, ce qui est suffisamment rapide pour traiter des tâches en temps réel à plus de 50 FPS. D'une part, YOLOv8 et YOLOv9 ont fourni des détections régulières et fiables tout au long de la vidéo. Il est intéressant de noter que YOLOv10, conçu pour une latence plus faible, était plus rapide mais a montré quelques incohérences dans la détection de certains types d'objets.
YOLO11, quant à lui, s'est distingué par sa précision, offrant un solide équilibre entre vitesse et précision. Bien qu'aucun des modèles ne soit parfaitement performant dans chaque image, la comparaison côte à côte a clairement démontré que YOLO11 offrait la meilleure performance globale.
La sélection d'un modèle pour un projet dépend de ses exigences spécifiques. Par exemple, certaines applications peuvent donner la priorité à la vitesse, tandis que d'autres peuvent nécessiter une plus grande précision ou faire face à des contraintes de déploiement qui influencent la décision.
Un autre facteur important est le type de tâches de vision par ordinateur auxquelles tu dois répondre. Si tu cherches une plus grande flexibilité pour différentes tâches, YOLOv8 et YOLO11 sont de bonnes options.
Le choix de YOLOv8 ou de YOLO11 dépend vraiment de tes besoins. YOLOv8 est une option solide si tu es novice en matière de vision par ordinateur et que tu apprécies une plus grande communauté, davantage de tutoriels et des intégrations tierces étendues .
D'un autre côté, si tu cherches des performances de pointe avec une meilleure précision et une plus grande vitesse, YOLO11 est le meilleur choix, bien qu'il soit accompagné d'une communauté plus petite et de moins d'intégrations en raison du fait qu'il s'agit d'une version plus récente.
D'Ultralytics YOLOv8 à Ultralytics YOLO11, l'évolution de la série de modèles YOLO reflète une poussée constante vers des modèles de vision par ordinateur plus intelligents. Chaque version de YOLO apporte des améliorations significatives en termes de vitesse, d'exactitude et de précision.
Alors que la vision par ordinateur continue de progresser, ces modèles offrent des solutions fiables aux défis du monde réel, de la détection d'objets aux systèmes autonomes. Le développement continu des modèles YOLO montre à quel point le domaine a progressé et ce que nous pouvons attendre de l'avenir.
Pour en savoir plus sur l'IA, visite notre dépôt GitHub et engage-toi auprès de notre communauté. Découvre les avancées dans tous les secteurs, de Vision AI dans la fabrication à la vision par ordinateur dans les soins de santé. Jette un œil à nos options de licence pour commencer tes projets Vision AI dès aujourd'hui.
Commence ton voyage avec le futur de l'apprentissage automatique.