Exécution des modèles YOLO d'Ultralytics sur l'AI PC d'Intel avec OpenVino

Abirami Vina

4 min lire

9 octobre 2024

Revoir l'exposé de Dmitriy Pastushenkov et Adrian Boguszewski sur YOLO Vision 2024 concernant l'optimisation des modèles YOLO avec Intel OpenVino et l'exécution d'inférences en temps réel sur l'AI PC d'Intel.

YOLO Vision 2024 (YV24), l'événement hybride annuel d'Ultralytics, a rassemblé des passionnés d'IA, des développeurs et des experts du monde entier pour explorer les dernières innovations en matière de vision par ordinateur. YV24 a été une excellente occasion et une plateforme pour discuter des nouvelles percées. Des acteurs clés de l'industrie de l'IA y ont présenté leurs dernières innovations. Parmi eux, Intel a participé à l'événement en présentant un exposé sur son nouveau PC d'IA révolutionnaire et sur l' intégration d'Intel OpenVino avec les modèles YOLO d'Ultralytics, comme Ultralytics YOLO11.

La présentation a été menée par Adrian Boguszewski, un Software Evangelist qui a coécrit le jeu de données LandCover.ai et éduque les développeurs sur la boîte à outils OpenVINO d'Intel, et Dmitriy Pastushenkov, un AI PC Evangelist avec plus de 20 ans d'expérience dans l'automatisation industrielle et l'IA. Au cours de l'événement, Adrian a partagé son enthousiasme et a déclaré : "C'est un grand événement aujourd'hui, non seulement parce qu'Ultralytics a livré une nouvelle version de YOLO, mais aussi parce que nous sommes en mesure de présenter ce nouveau modèle fonctionnant sur notre nouveau matériel, ainsi qu'une nouvelle version d'OpenVINO."

Dans cet article, nous allons examiner les points essentiels de la présentation d'Intel à l'YV24, en approfondissant les tenants et les aboutissants de leur PC IA, la série Intel Core Ultra 200V, et la façon dont ils s'intègrent aux modèles YOLO d'Ultralytics à l'aide de la boîte à outils OpenVINO. C'est parti !

Les technologies de pointe en matière d'IA en 2024

Dmitriy a commencé sa présentation en examinant les principales différences entre l'IA traditionnelle et l'IA générative. L'accent a été mis sur l'évolution de ces technologies et de leurs cas d'utilisation en 2024. Les techniques d'IA traditionnelles telles que la vision par ordinateur et le traitement du langage naturel ont été essentielles pour des tâches telles que l'estimation de la pose, la détection d'objets et la reconnaissance vocale. L'IA générative, quant à elle, représente une nouvelle vague de technologies d'IA qui implique des applications telles que les chatbots, la génération de texte à partir d'images, l'écriture de code et même la conversion de texte en vidéo

__wf_reserved_inherit
Fig. 1. Adrian et Dmitriy d'Intel, sur la scène d'YV24, discutant des cas d'utilisation de l'IA.

Dmitriy a souligné la différence d'échelle entre les deux. Il a expliqué que si les modèles d'IA traditionnels se composent de millions de paramètres, les modèles d'IA générative opèrent à une échelle beaucoup plus grande. Les modèles d'IA générative impliquent souvent des milliards, voire des trillions de paramètres, ce qui les rend beaucoup plus exigeants sur le plan informatique.

Le PC Intel AI : Une nouvelle frontière pour le matériel d'IA

Dmitriy a présenté l'Intel AI PC comme une nouvelle solution matérielle conçue pour répondre aux défis croissants de l'exécution efficace des modèles d'IA traditionnels et génératifs. L'Intel AI PC est une machine puissante et économe en énergie. Il est capable d'exécuter un large éventail de modèles d'IA localement, sans avoir besoin d'un traitement basé sur le cloud. 

Le traitement local permet de préserver la confidentialité des données sensibles. Lorsque les modèles d'IA peuvent fonctionner indépendamment des connexions internet, les préoccupations éthiques des industries en matière de confidentialité et de sécurité trouvent une réponse.

La force motrice de l'Intel AI PC est le processeur Intel Core Ultra 200V Series. Ce processeur intègre trois composants clés : l'unité centrale de traitement (CPU), l'unité de traitement graphique (GPU) et l'unité de traitement neuronal (NPU). Chacun joue un rôle spécifique dans la gestion de différents types de charges de travail d'intelligence artificielle. Le CPU est idéal pour les petites tâches à faible latence qui nécessitent des réponses rapides, tandis que le GPU est optimisé pour les opérations à haut débit telles que l'exécution de modèles d'IA. Le NPU, conçu pour l'efficacité énergétique, est bien adapté aux tâches de longue durée telles que la détection d'objets en temps réel avec des modèles comme YOLO11

Il a été souligné que le CPU peut fournir jusqu'à 5 TOPS (Trillions d'opérations par seconde), le GPU jusqu'à 67 TOPS, et le NPU fournit un moyen économe en énergie pour exécuter des tâches d'intelligence artificielle en continu sans épuiser les ressources du système.

Les avancées d'Intel en matière d'IA : Série Intel Core Ultra 200V

Le processeur Intel Core Ultra 200V intègre les trois moteurs d'intelligence artificielle - NPU, CPU et GPU - dans une seule petite puce. Sa conception est parfaitement adaptée aux appareils compacts tels que les ordinateurs portables, sans sacrifier les performances.

Le processeur intègre également de la mémoire vive, ce qui évite d'avoir recours à des cartes graphiques séparées. Cela permet de réduire la consommation d'énergie et de maintenir l'appareil compact. M. Dmitriy a également mis l'accent sur la flexibilité du processeur. Les utilisateurs peuvent décider d'exécuter les modèles d'IA sur le CPU, le GPU ou le NPU, en fonction de la tâche à accomplir. Par exemple, la détection d'objets avec les modèles YOLO11 peut être exécutée sur n'importe lequel de ces moteurs, tandis que les tâches plus complexes, comme la génération de texte à partir d'images, peuvent utiliser à la fois le GPU et le NPU pour de meilleures performances.

Pendant la présentation, Dmitriy a sorti la puce de sa poche, ce qui a permis à tout le monde de se rendre compte de sa petite taille, malgré sa capacité à gérer des tâches d'IA aussi avancées. C'était une façon amusante et mémorable de montrer comment Intel apporte de puissantes capacités d'IA à des appareils plus portables et plus pratiques.

__wf_reserved_inherit
Fig. 2. Le processeur Intel Core Ultra 2000V tient dans une poche.

Optimiser les modèles d'IA avec Intel OpenVino

Après avoir présenté les dernières avancées matérielles d'Intel, Dmitriy est passé à la pile logicielle d'Intel qui prend en charge l'IA. Il a présenté OpenVINO, le cadre open-source d'Intel conçu pour optimiser et déployer efficacement les modèles d'IA sur différents appareils. OpenVINO va au-delà des tâches visuelles, étendant son support aux modèles d'IA utilisés pour le traitement du langage naturel, le traitement audio, les transformateurs, etc.

OpenVINO est compatible avec des plateformes populaires telles que PyTorch, TensorFlow et ONNX, et les développeurs peuvent facilement l'intégrer dans leurs flux de travail. La quantification est une fonctionnalité clé sur laquelle il a attiré l'attention. La quantification compresse les poids des modèles pour réduire leur taille, de sorte que les modèles de grande taille peuvent fonctionner sans problème sur des appareils locaux sans avoir recours au cloud. OpenVINO fonctionne dans plusieurs cadres, sur CPU, GPU, NPU, FPGA ou même ARM, et prend en charge Windows, Linux et macOS. Dmitriy a également expliqué à l'auditoire à quel point il est facile de démarrer avec OpenVINO. 

__wf_reserved_inherit
Fig 3. Dmitriy explique comment démarrer avec OpenVino.

Intégration d'Ultralytics avec Intel OpenVino

Dans la deuxième partie de l'exposé, le micro a été passé à Adrian, qui a expliqué l'intégration transparente entre les modèles YOLO d'Ultralytics et la boîte à outils OpenVINO d'Intel, ce qui simplifie le processus de déploiement des modèles YOLO. Il a expliqué étape par étape comment l'exportation d'un modèle YOLO au format OpenVINO à l'aide du package Ultralytics Python est rapide et simple. Cette intégration permet aux développeurs d'optimiser plus facilement leurs modèles pour le matériel Intel et de tirer le meilleur parti des deux plates-formes.

__wf_reserved_inherit
Fig. 4. Adrian explique comment Ultralytics facilite l'exportation de votre modèle au format OpenVino.

Adrian a démontré qu'une fois qu'un modèle YOLO d'Ultralytics est formé, les utilisateurs peuvent l'exporter en utilisant quelques drapeaux de ligne de commande simples. Par exemple, les utilisateurs peuvent spécifier s'ils souhaitent exporter le modèle en tant que version à virgule flottante pour une précision maximale ou en tant que version quantifiée pour plus de rapidité et d'efficacité. Il a également expliqué comment les développeurs peuvent gérer ce processus directement dans le code, en utilisant des options telles que la quantification INT8 pour améliorer les performances sans sacrifier trop de précision. 

Démonstrations d'IA en temps réel sur l'Intel AI PC

En mettant toute cette théorie en pratique, l'équipe d'Intel a présenté une démonstration en temps réel de la détection d'objets en exécutant YOLO11 sur l'Intel AI PC. Adrian a montré comment le système gérait le modèle sur différents processeurs, atteignant 36 images par seconde (FPS) sur le CPU avec un modèle à virgule flottante, plus de 100 FPS sur le GPU intégré et 70 FPS avec la version quantifiée INT8. Ils ont pu montrer à quel point l'Intel AI PC peut gérer efficacement des tâches d'intelligence artificielle complexes.

Il a également souligné que le système peut exécuter des modèles en parallèle, en utilisant le CPU, le GPU et le NPU ensemble pour les tâches où toutes les données ou images vidéo sont disponibles d'emblée. Cette fonction est utile pour le traitement de charges lourdes comme les vidéos. Le système peut répartir la charge de travail sur différents processeurs, ce qui le rend plus rapide et plus efficace.

Pour conclure, Adrian a indiqué que les utilisateurs pouvaient essayer des démonstrations chez eux, notamment des solutions telles que le comptage de personnes et la gestion intelligente des files d'attente. Il a ensuite présenté une démo bonus dans laquelle les utilisateurs pouvaient saisir des invites pour générer des images oniriques en temps réel sur le GPU. Cette démonstration a mis en évidence la polyvalence de l'Intel AI PC pour les tâches d'IA traditionnelles et les projets d'IA créatifs et génératifs.

Détection d'objets en temps réel avec Intel OpenVINO

Lors de l'événement, Intel a tenu un stand où elle a présenté une démonstration de détection d'objets en temps réel à l'aide de YOLO11, fonctionnant sur son Intel AI PC. Les participants ont pu voir le modèle en action, optimisé avec OpenVINO et déployé sur le processeur Intel Core Ultra 200V. 

__wf_reserved_inherit
Fig 5. Les participants ont pu assister à une démonstration en temps réel sur le stand Intel OpenVino.

Sur le stand d'Intel, Dmitry a déclaré : "C'est la première fois que je participe à YOLO Vision et je suis heureux d'être à Madrid. Nous présentons le modèle YOLO11 d'Ultralytics, qui fonctionne sur le processeur Intel Core Ultra 200V. Il présente d'excellentes performances et nous utilisons OpenVINO pour optimiser et déployer le modèle. Il a été très facile de collaborer avec Ultralytics et d'exécuter le modèle sur le matériel Intel le plus récent, en utilisant le CPU, le GPU et le NPU. Le stand proposait également des cadeaux amusants, tels que des t-shirts et des ordinateurs portables que les participants pouvaient emporter chez eux.

Principaux enseignements

La présentation technique d'Intel à YV24, avec les processeurs Intel Core Ultra 200V, a montré comment la boîte à outils OpenVINO optimise les modèles d'intelligence artificielle comme Ultralytics YOLO11. Cette intégration permet aux utilisateurs d'exécuter les modèles YOLO directement sur leurs appareils, offrant ainsi d'excellentes performances pour les tâches de vision artificielle telles que la détection d'objets. L'avantage principal est que les utilisateurs n'ont pas besoin de s'appuyer sur des services en nuage.

Les développeurs et les passionnés d'IA peuvent exécuter et affiner les modèles YOLO sans effort, en utilisant pleinement le matériel comme les CPU, GPU et NPU pour les applications en temps réel. La boîte à outils Intel OpenVINO, associée aux modèles YOLO d'Ultralytics, ouvre de nouvelles possibilités pour apporter des capacités d'IA avancées directement sur les appareils personnels, ce qui en fait une option idéale pour les développeurs désireux d'apporter des innovations en matière d'IA dans divers secteurs d'activité.

Collaborons et innovons ! Visitez notre dépôt GitHub pour explorer nos contributions et vous engager avec notre communauté. Découvrez comment nous utilisons l'IA pour avoir un impact dans des secteurs tels que la fabrication et la santé.

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers