Contrôle vert
Lien copié dans le presse-papiers

Exécuter Ultralytics YOLO Modèles sur Intel's AI PC avec OpenVino

Revisite l'exposé de Dmitriy Pastushenkov et Adrian Boguszewski YOLO Vision 2024 sur l'optimisation des modèles YOLO avec Intel OpenVino et l'exécution d'inférences en temps réel sur Intel's AI PC.

YOLO Vision 2024 (YV24), Ultralytics' événement hybride annuel, a rassemblé des passionnés d'IA, des développeurs et des experts du monde entier pour explorer les dernières innovations en matière de vision par ordinateur. YV24 a été une excellente occasion et une plateforme pour discuter des nouvelles percées. L'événement a permis à des acteurs clés de l'industrie de l'IA de présenter leurs dernières innovations. Parmi eux, Intel, qui a participé à l'événement en présentant un exposé sur son nouveau PC d'IA révolutionnaire et Intel OpenVino l'intégration avec Ultralytics YOLO des modèles comme . Ultralytics YOLO11.

La conférence a été animée par Adrian Boguszewski, un évangéliste logiciel qui a coécrit l'ensemble de données LandCover.ai et éduque les développeurs sur la boîte à outils OpenVINO de Intel, et Dmitriy Pastushenkov, un évangéliste AI PC avec plus de 20 ans d'expérience dans l'automatisation industrielle et l'IA. Au cours de l'événement, Adrian a partagé son excitation et a déclaré : "C'est un grand événement aujourd'hui, non seulement parce que Ultralytics a livré une nouvelle version de YOLO , mais aussi parce que nous sommes en mesure de présenter ce nouveau modèle fonctionnant sur notre nouveau matériel, ainsi qu'une nouvelle version de OpenVINO."

Dans cet article, nous allons jeter un coup d'œil sur les points essentiels de l'intervention deIntelà YV24, en approfondissant les tenants et les aboutissants de leur PC IA, la série Intel Core Ultra 200V, et la façon dont ils s'intègrent aux modèles Ultralytics YOLO à l'aide de la boîte à outils OpenVINO . C'est parti !

Les technologies de pointe en matière d'IA en 2024

Dmitriy a commencé la keynote en plongeant dans les principales différences entre l'IA traditionnelle et l'IA générative. L'accent a été mis sur la façon dont ces technologies et leurs cas d'utilisation évoluent en 2024. Les techniques d'IA traditionnelles comme la vision par ordinateur et le traitement du langage naturel ont été essentielles pour des tâches comme l'estimation de la pose, la détection d'objets et la reconnaissance vocale. L'IA générative, cependant, représente une nouvelle vague de technologie d'IA qui implique des applications telles que les chatbots, la génération de texte à image, l'écriture de code, et même le texte à vidéo

Fig 1. Adrian et Dmitriy de Intel, sur la scène d'YV24, discutant des cas d'utilisation de l'IA.

Dmitriy a souligné la différence d'échelle entre les deux. Il a expliqué que si les modèles d'IA traditionnels se composent de millions de paramètres, les modèles d'IA génératifs fonctionnent à une échelle beaucoup plus grande. Les modèles d'IA générative impliquent souvent des milliards, voire des trillions de paramètres, ce qui les rend beaucoup plus exigeants sur le plan informatique.

Le Intel AI PC : Une nouvelle frontière matérielle pour l'IA

Dmitriy a présenté l'AI PC Intel comme une nouvelle solution matérielle conçue pour répondre aux défis croissants de l'exécution efficace des modèles d'IA traditionnels et génératifs. L'AI PC Intel est une machine puissante et économe en énergie. Il est capable d'exécuter un large éventail de modèles d'IA localement, sans avoir besoin d'un traitement basé sur le cloud. 

Le traitement local permet de préserver la confidentialité des données sensibles. Lorsque les modèles d'IA peuvent fonctionner indépendamment des connexions Internet, les préoccupations éthiques des industries en matière de confidentialité et de sécurité trouvent une réponse.

La force motrice du Intel AI PC est le processeur Intel Core Ultra 200V Series. Ce processeur intègre trois composants clés : l'unité centrale de traitement (CPU), l'unité de traitement graphique (GPU) et l'unité de traitement neuronal (NPU). Chacun joue un rôle spécifique dans la gestion de différents types de charges de travail d'intelligence artificielle. L'unité CPU est idéale pour les petites tâches à faible latence qui nécessitent des réponses rapides, tandis que l'unité GPU est optimisée pour les opérations à haut débit telles que l'exécution de modèles d'IA. Le NPU, conçu pour l'efficacité énergétique, est bien adapté aux tâches de longue durée telles que la détection d'objets en temps réel avec des modèles tels que . YOLO11

Il a été souligné que le site CPU peut fournir jusqu'à 5 TOPS (Trillions d'opérations par seconde), le site GPU jusqu'à 67 TOPS, et que le NPU fournit un moyen économe en énergie pour exécuter des tâches d'IA en continu sans épuiser les ressources du système.

IntelLes progrès de l'IA Intel Série Core Ultra 200V

Le processeur Intel Core Ultra 200V intègre les trois moteurs d'intelligence artificielle - NPU, CPU et GPU - dans une seule petite puce. Sa conception est parfaitement adaptée aux appareils compacts comme les ordinateurs portables, sans sacrifier les performances.

Le processeur comprend également une mémoire vive intégrée, ce qui réduit le besoin de cartes graphiques séparées. Cela permet de réduire la consommation d'énergie et de garder l'appareil compact. Dmitriy a également mis l'accent sur la flexibilité du processeur. Les utilisateurs peuvent décider d'exécuter les modèles d'intelligence artificielle sur CPU, GPU ou NPU, en fonction de la tâche à accomplir. Par exemple, la détection d'objets avec les modèles YOLO11 peut être exécutée sur l'un ou l'autre de ces moteurs, tandis que les tâches plus complexes, comme la génération de texte à partir d'images, peuvent utiliser à la fois le GPU et le NPU pour de meilleures performances.

Pendant la présentation, Dmitriy a sorti la puce de sa poche, ce qui a permis à tout le monde de se rendre compte à quel point elle est vraiment petite - malgré sa capacité à gérer des tâches d'IA aussi avancées. C'était une façon amusante et mémorable de montrer comment Intel apporte de puissantes capacités d'intelligence artificielle à des appareils plus portables et plus pratiques.

Fig 2. Le processeur Intel Core Ultra 2000V tient dans une poche.

Optimiser les modèles d'IA avec Intel OpenVino

Après avoir présenté les dernières avancées matérielles de Intel, Dmitriy est passé à la pile logicielle de Intel qui prend en charge l'IA. Il a présenté OpenVINO, le cadre open-source de Intelconçu pour optimiser et déployer efficacement les modèles d'IA sur différents appareils. OpenVINO va au-delà des tâches visuelles, en étendant sa prise en charge aux modèles d'IA utilisés pour le traitement du langage naturel, le traitement audio, les transformateurs, etc.

OpenVINO est compatible avec des plateformes populaires comme PyTorchTensorFlow, et ONNXet les développeurs peuvent facilement l'intégrer à leur flux de travail. La quantification est une caractéristique clé sur laquelle il a attiré l'attention. La quantification compresse les poids des modèles pour réduire leur taille, de sorte que les modèles volumineux peuvent fonctionner sans problème sur les appareils locaux sans avoir recours au cloud. OpenVINO fonctionne sur plusieurs cadres, sur CPU, GPU, NPU, FPGA ou même sur les appareils ARM, et prend en charge Windows, Linux et macOS. Dmitriy a également expliqué au public à quel point il est facile de démarrer avec OpenVINO. 

Fig 3. Dmitriy explique comment démarrer avec OpenVino.

Intégrer Ultralytics avec Intel OpenVino

Dans la deuxième partie de l'exposé, le micro a été passé à Adrian, qui a expliqué l'intégration transparente entre les modèles Ultralytics YOLO et la boîte à outils OpenVINO de Intel, ce qui simplifie le processus de déploiement des modèlesYOLO . Il a expliqué étape par étape comment exporter un modèle YOLO à l'aide du paquetageUltralytics Python au format OpenVINO est rapide et simple. Cette intégration permet aux développeurs d'optimiser plus facilement leurs modèles pour le matériel Intel et de tirer le meilleur parti des deux plates-formes.

Fig 4. Adrian explique comment Ultralytics facilite l'exportation de ton modèle au format OpenVino .

Adrian a démontré qu'une fois qu'un modèle Ultralytics YOLO est formé, les utilisateurs peuvent l'exporter à l'aide de quelques indicateurs simples de la ligne de commande. Par exemple, les utilisateurs peuvent spécifier s'ils veulent exporter le modèle en tant que version à virgule flottante pour une précision maximale ou en tant que version quantifiée pour plus de rapidité et d'efficacité. Il a également souligné comment les développeurs peuvent gérer ce processus directement par le biais du code, en utilisant des options telles que la quantification INT8 pour améliorer les performances sans sacrifier trop de précision. 

Démonstrations d'IA en temps réel sur le PC d'IA Intel

En mettant toute cette théorie en pratique, l'équipe de Intel a présenté une démo en temps réel de la détection d'objets en l'exécutant YOLO11 sur le PC Intel AI. Adrian a montré comment le système gérait le modèle sur différents processeurs, atteignant 36 images par seconde (FPS) sur le site CPU avec un modèle à virgule flottante, plus de 100 FPS sur le site intégré GPU, et 70 FPS avec la version quantifiée INT8. Ils ont pu montrer à quel point l'ordinateur Intel AI PC peut gérer efficacement des tâches complexes d'intelligence artificielle.

Il a également souligné que le système peut exécuter des modèles en parallèle, en utilisant les sites CPU, GPU, et NPU ensemble pour les tâches où toutes les données ou images vidéo sont disponibles d'emblée. Cela s'avère utile lors du traitement de charges lourdes comme les vidéos. Le système peut répartir la charge de travail sur différents processeurs, ce qui le rend plus rapide et plus efficace.

Pour conclure, Adrian a mentionné que les utilisateurs pouvaient essayer des démonstrations à la maison, y compris des solutions telles que le comptage de personnes et la gestion intelligente des files d'attente. Il a ensuite montré une démo bonus dans laquelle les utilisateurs pouvaient saisir des invites pour générer des images oniriques en temps réel sur le site GPU. Cela a démontré la polyvalence du PC IA Intel pour les tâches d'IA traditionnelles et les projets d'IA créatifs et génératifs.

Détection d'objets en temps réel avec Intel OpenVINO

Lors de l'événement, Intel avait un stand où ils ont présenté une démonstration de détection d'objets en temps réel à l'aide de YOLO11, fonctionnant sur leur PC Intel AI. Les participants ont pu voir le modèle en action, optimisé avec OpenVINO, et déployé sur le processeur Intel Core Ultra 200V. 

Fig 5. Les participants ont eu l'occasion de voir une démonstration en temps réel sur le stand Intel OpenVino .

Au stand Intel , Dmitry a déclaré : "C'est la première fois que je participe à YOLO Vision, et je suis heureux d'être à Madrid. Nous présentons le modèle YOLO11 de Ultralytics, qui fonctionne sur le processeur Intel Core Ultra 200V. Il présente d'excellentes performances et nous utilisons OpenVINO pour optimiser et déployer le modèle. Il a été très facile de collaborer avec Ultralytics et d'exécuter le modèle sur le dernier matériel Intel , en utilisant CPU, GPU et NPU." Le stand proposait également des cadeaux amusants, tels que des t-shirts et des ordinateurs portables que les participants pouvaient emporter chez eux.

Principaux enseignements

IntelLa conférence technique de YV24, qui présentait les processeurs de la série Intel Core Ultra 200V, a montré comment la boîte à outils OpenVINO optimise les modèles d'intelligence artificielle tels que Ultralytics YOLO11 . Cette intégration permet aux utilisateurs d'exécuter les modèles YOLO directement sur leurs appareils, offrant ainsi d'excellentes performances pour les tâches de vision artificielle telles que la détection d'objets. L'avantage principal est que les utilisateurs n'ont pas besoin de s'appuyer sur des services en nuage.

Les développeurs et les passionnés d'IA peuvent exécuter et affiner les modèles YOLO sans effort, en utilisant pleinement le matériel comme les CPU, les GPU et les NPU pour les applications en temps réel. Intel OpenVINO toolkit, en combinaison avec Ultralytics YOLO models, ouvre de nouvelles possibilités pour apporter des capacités d'IA avancées directement sur les appareils personnels, ce qui en fait une option idéale pour les développeurs désireux de conduire des innovations en matière d'IA dans divers secteurs d'activité.

Collaborons et innovons ! Visite notre dépôt GitHub pour explorer nos contributions et t'engager avec notre communauté. Vois comment nous utilisons l'IA pour avoir un impact dans des secteurs comme la fabrication et les soins de santé.

Logo FacebookLogo de TwitterLogo LinkedInSymbole du lien de copie

Lire la suite dans cette catégorie

Construisons ensemble le futur
de l'IA !

Commence ton voyage avec le futur de l'apprentissage automatique.