Glossaire

Déploiement du modèle

Découvre l'essentiel du déploiement de modèles, en transformant les modèles ML en outils du monde réel pour les prédictions, l'automatisation et les insights pilotés par l'IA.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Le déploiement de modèles est le processus critique qui consiste à prendre un modèle d'apprentissage machine (ML) entraîné et à le rendre disponible pour une utilisation dans un environnement de production en direct. Cette étape fait passer le modèle d'une phase de développement ou de test à un outil opérationnel capable de générer des prédictions(inférence) sur de nouvelles données du monde réel. C'est une étape cruciale du cycle de vie de l'apprentissage automatique, qui comble le fossé entre la construction d'un modèle ML et son utilisation effective pour apporter de la valeur aux applications, aux systèmes ou aux processus métier.

Pertinence du déploiement du modèle

Sans un déploiement efficace, même le modèle le plus précis reste un exercice académique, incapable de fournir des avantages tangibles. Le déploiement est essentiel pour réaliser le retour sur investissement (ROI ) des projets d'IA et de ML. Il permet aux organisations d'automatiser des tâches, d'obtenir des informations exploitables à partir des données, d'améliorer les expériences des utilisateurs et de favoriser une prise de décision éclairée. Un déploiement réussi garantit que les ressources investies dans la formation des modèles se traduisent par des résultats pratiques. Le fonctionnement continu implique souvent la surveillance des modèles pour s'assurer que les performances ne se dégradent pas au fil du temps en raison de facteurs tels que la dérive des données.

Applications du déploiement de modèles

Le déploiement de modèles permet une vaste gamme d'applications alimentées par l'IA dans tous les secteurs d'activité. Voici quelques exemples :

  • Gestion des stocks dans le commerce de détail : Déployer un modèle de détection d'objets, comme un Ultralytics YOLO dans un magasin de détail permet aux caméras de surveiller automatiquement les stocks en rayon, de suivre les niveaux d'inventaire et d'alerter le personnel lorsque les articles viennent à manquer, optimisant ainsi la gestion des stocks et réduisant les vérifications manuelles.
  • Systèmes autonomes : Les voitures et les drones autopilotés s'appuient fortement sur des modèles déployés pour la perception et la navigation. Les modèles entraînés pour des tâches telles que la détection d'objets, la segmentation et la planification de trajectoires sont déployés sur les ordinateurs de bord du système pour interpréter les données des capteurs en temps réel.

Considérations importantes dans le déploiement du modèle

Le déploiement efficace des modèles de ML nécessite une planification minutieuse autour de plusieurs facteurs :

  • Évolutivité: L'infrastructure de déploiement doit gérer des charges variables, en augmentant ou en réduisant l'échelle en fonction de la demande. Cela est souvent géré à l'aide de plateformes de cloud computing ou de systèmes d'orchestration de conteneurs.
  • Temps de latence et débit : Les applications nécessitent souvent une faible latence pour des réponses en temps réel. L'optimisation des modèles à l'aide de techniques telles que la quantification ou l'élagage, et l'utilisation de temps d'exécution efficaces, peuvent aider à répondre aux exigences de performance.
  • Environnement de déploiement : Les modèles peuvent être déployés sur des serveurs (dans le nuage ou sur place), directement dans les applications, ou sur des appareils à ressources limitées via l'informatique périphérique. Le déploiement sur des appareils périphériques nécessite une optimisation du modèle en termes de taille et d'efficacité de calcul.
  • Servir le modèle: Il s'agit d'héberger le modèle, souvent via une API (interface de programmation d'applications), permettant aux applications d'envoyer des données et de recevoir des prédictions. Des technologies comme Docker sont fréquemment utilisées pour conditionner les modèles et leurs dépendances dans des conteneurs portables pour un déploiement cohérent.
  • Maintenance : Les modèles déployés ont besoin d'une surveillance continue et d'un recyclage ou d'une mise à jour potentielle pour maintenir les performances et s'adapter à l'évolution des modèles de données. Cela relève de la pratique plus large des MLOps (opérations d'apprentissage automatique).

Outils et plateformes

Divers outils et plateformes simplifient le processus de déploiement. Les frameworks offrent souvent des capacités d'exportation de modèles vers divers formats adaptés à différentes cibles de déploiement. Des plateformes comme Ultralytics HUB offrent des solutions intégrées pour la formation, le suivi et le déploiement de modèles de vision par ordinateur, rationalisant ainsi le flux de travail du développement à la production. D'autres outils dédiés au service de modèles et des services de fournisseurs de cloud offrent également des fonctions de déploiement complètes.

Tout lire