Découvre comment l'observabilité améliore les systèmes AI/ML comme Ultralytics YOLO . Acquiers des connaissances, optimise les performances et assure la fiabilité dans les applications du monde réel.
L'observabilité fournit des informations essentielles sur le comportement et les performances des systèmes complexes, particulièrement vitales dans le domaine dynamique de l'intelligence artificielle (IA) et de l'apprentissage automatique (ML). Pour les utilisateurs qui travaillent avec des modèles sophistiqués comme Ultralytics YOLO, comprendre l'état interne des applications déployées grâce à leurs sorties externes est essentiel pour maintenir la fiabilité, optimiser les performances et garantir la fiabilité.
L'observabilité est la capacité de mesurer et de comprendre les états internes d'un système en examinant ses sorties, telles que les journaux, les mesures et les traces. Contrairement à la surveillance traditionnelle, qui se concentre généralement sur des tableaux de bord prédéfinis et des modes de défaillance connus (par exemple, l'utilisation du CPU , les taux d'erreur), l'observabilité permet aux équipes d'explorer de manière proactive le comportement du système et de diagnostiquer de nouveaux problèmes - même ceux qui n'ont pas été anticipés pendant le développement. Dans le contexte des MLOps, elle permet de poser des questions plus approfondies sur les raisons pour lesquelles un système se comporte d'une certaine manière, ce qui est crucial pour la nature itérative du développement et du déploiement des modèles de ML.
La complexité et la nature souvent "boîte noire" des modèles d'apprentissage profond rendent l'observabilité indispensable. Les principales raisons sont les suivantes :
Bien qu'elles soient liées, l'observabilité et la surveillance diffèrent en termes de portée et d'objectif. La surveillance implique la collecte et l'analyse de données sur des paramètres prédéfinis afin de suivre l'état de santé du système par rapport à des points de référence connus. L'observabilité, quant à elle, utilise les données de sortie (journaux, mesures, traces - souvent appelés les"trois piliers de l'observabilité") pour permettre une analyse exploratoire plus profonde, te permettant de comprendre le "pourquoi" des états du système, en particulier ceux qui sont inattendus. La surveillance, c'est comme regarder un tableau de bord, tandis que l'observabilité, c'est avoir les outils nécessaires pour enquêter sur toute anomalie apparaissant sur ce tableau de bord ou ailleurs.
La mise en œuvre de l'observabilité implique souvent l'intégration de divers outils. Les plateformes généralistes comme Datadog, Grafana et Prometheus sont largement utilisées pour collecter et visualiser les métriques et les journaux. Des normes comme OpenTelemetry aident à instrumenter les applications pour générer des données de trace. Dans l'espace ML, des plateformes comme Weights & Biases, MLflow et Ultralytics HUB offrent des fonctionnalités spécialisées pour le suivi des expériences, la surveillance des performances des modèles et la gestion du cycle de vie de la ML, en intégrant des principes d'observabilité clés pour la surveillance et la maintenance des modèles.