Glossaire

Modèle Servir

Apprends l'essentiel du service de modèles - déploie des modèles d'IA pour des prédictions en temps réel, l'évolutivité et l'intégration transparente dans les applications.

Une fois qu'un modèle de Machine Learning (ML) est formé et validé, l'étape critique suivante consiste à le rendre disponible pour générer des prédictions sur de nouvelles données. Ce processus est connu sous le nom de Model Serving. Il consiste à déployer un modèle entraîné dans un environnement de production, généralement derrière un point de terminaison API, ce qui permet aux applications ou à d'autres systèmes de demander des prédictions en temps réel. Le service de modèle sert de pont entre le modèle développé et son application pratique, le transformant d'un fichier statique en un service actif et générateur de valeur dans le cadre plus large du cycle de vie de l'apprentissage automatique.

Importance du service de modèles

Le service de modèle est fondamental pour rendre opérationnels les modèles de ML. Sans cela, même les modèles les plus précis, comme les modèles de pointe. Ultralytics YOLO restent isolés dans des environnements de développement, incapables d'avoir un impact sur les processus du monde réel. Un service de modèle efficace garantit :

Accessibilité : Met les prédictions du modèle à la disposition de diverses applications via des interfaces standard comme une API REST ou gRPC.
Évolutivité : gère des charges variables de demandes de prédiction, en garantissant des performances constantes à mesure que la demande évolue. Les plateformes cloud comme Amazon SageMaker et Google Cloud AI Platform proposent des solutions de mise à l'échelle gérées.
Fiabilité : Fournit un service stable et continuellement disponible pour les applications critiques.
Performance : Optimise la latence de l'inférence pour permettre des cas d'utilisation de l'inférence en temps réel dans des domaines tels que la vision par ordinateur et le traitement du langage naturel (NLP).

Applications dans le monde réel

Le service de modèle permet d'innombrables fonctionnalités pilotées par l'IA avec lesquelles nous interagissons quotidiennement. En voici deux exemples :

Recommandations de produits pour le commerce électronique : Lorsque tu navigues dans une boutique en ligne, un modèle de serveur alimente le système de recommandation. Il prend en compte ton historique de navigation ou ton profil d'utilisateur et renvoie des suggestions de produits personnalisées en temps réel.
Aide au diagnostic médical : Dans le domaine de la santé, des modèles entraînés pour l'analyse d'images médicales peuvent être servis via une API. Les médecins peuvent télécharger les scans des patients (comme les radiographies ou les IRM) vers le service, qui renvoie ensuite les anomalies potentielles ou les idées de diagnostic, aidant ainsi à la prise de décision clinique. Des plateformes comme Ultralytics HUB facilitent le déploiement de ces modèles spécialisés.

Composantes clés du service modèle

La mise en place d'un système robuste de desserte des modèles implique plusieurs éléments :

Format du modèle : Le modèle formé doit être sauvegardé dans un format adapté au déploiement, tel que ONNXTensorFlow SavedModel, ou des formats optimisés tels que TensorRT.
Cadre de service : Des logiciels comme TensorFlow Serving, TorchServe ou NVIDIA Triton Inference Server gèrent le cycle de vie du modèle, traitent les demandes et effectuent l'inférence.
Point de terminaison API : Une interface (souvent gérée par une passerelle API) expose les capacités de prédiction du modèle aux applications clientes.
Infrastructure : L'environnement matériel et logiciel sous-jacent, qui peut être constitué de serveurs sur place, d'instances de cloud computing ou même d'appareils spécialisés de edge computing.
Surveillance : Les outils et les processus de surveillance des modèles permettent de suivre les performances, la latence, les erreurs et la dérive potentielle des données pour s'assurer que le modèle servi reste efficace au fil du temps.

Déploiement de modèles et service de modèles

Bien que les termes " déploiement de modèles " et " service de modèles " soient souvent liés, ils ne sont pas identiques. Le déploiement de modèles est le concept plus large de mise à disposition d'un modèle entraîné pour utilisation. Cela peut englober diverses stratégies, notamment l'intégration de modèles directement dans les applications, leur déploiement sur des appareils périphériques pour une inférence hors ligne, ou la mise en place de pipelines de traitement par lots qui exécutent des prédictions périodiquement. Tu peux explorer différentes options de déploiement de modèles en fonction de tes besoins.

Le service de modèle fait spécifiquement référence au déploiement d'un modèle en tant que service réseau, généralement accessible via une API, conçu pour traiter les demandes de prédiction à la demande, souvent en temps réel. Il s'agit d'un type spécifique de déploiement de modèle axé sur la fourniture de capacités d'inférence continues avec des considérations d'évolutivité et de faible latence. Pour de nombreuses applications interactives nécessitant des prédictions immédiates, le service de modèle est la méthode de déploiement préférée.

Modèle Servir

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Importance du service de modèles

Applications dans le monde réel

Composantes clés du service modèle

Déploiement de modèles et service de modèles

Lire plus de blogs

Rejoins la communauté Ultralytics

Modèle Servir

Entraîne les modèles YOLO simplementavec Ultralytics HUB

Solution flexible de licence d'entreprise pour alimenter ton innovation.

Entraîne des modèles d'IA en quelques secondes avec Ultralytics YOLO

Entraîne les modèles YOLO simplement avec Ultralytics HUB

Importance du service de modèles

Applications dans le monde réel

Composantes clés du service modèle

Déploiement de modèles et service de modèles

Lire plus de blogs

Rejoins la communauté Ultralytics

Entraîne les modèles YOLO simplement
avec Ultralytics HUB