Descubre cómo la observabilidad mejora los sistemas de IA/ML como Ultralytics YOLO . Obtén información, optimiza el rendimiento y garantiza la fiabilidad en aplicaciones del mundo real.
La observabilidad proporciona conocimientos críticos sobre el comportamiento y el rendimiento de sistemas complejos, especialmente vitales en el dinámico campo de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM). Para los usuarios que trabajan con modelos sofisticados como Ultralytics YOLO, comprender el estado interno de las aplicaciones desplegadas a través de sus salidas externas es clave para mantener la fiabilidad, optimizar el rendimiento y garantizar la fiabilidad.
La observabilidad es la capacidad de medir y comprender los estados internos de un sistema examinando sus salidas, como registros, métricas y trazas. A diferencia de la monitorización tradicional, que suele centrarse en cuadros de mando predefinidos y modos de fallo conocidos (por ejemplo, uso de CPU , tasas de error), la observabilidad equipa a los equipos para explorar proactivamente el comportamiento del sistema y diagnosticar problemas novedosos, incluso los no previstos durante el desarrollo. En el contexto de MLOps, permite plantear preguntas más profundas sobre por qué un sistema se comporta de una determinada manera, lo que es crucial para la naturaleza iterativa del desarrollo y despliegue de modelos ML.
La complejidad y la naturaleza a menudo de "caja negra" de los modelos de aprendizaje profundo hacen que la observabilidad sea indispensable. Entre las razones clave se incluyen:
Aunque están relacionadas, la observabilidad y la supervisión difieren en su alcance y finalidad. La monitorización implica recopilar y analizar datos sobre métricas predefinidas para realizar un seguimiento del estado del sistema en comparación con puntos de referencia conocidos. La observabilidad, sin embargo, utiliza las salidas de datos (registros, métricas, trazas -a menudo denominados los"tres pilares de la observabilidad"-) para permitir un análisis exploratorio más profundo, que te permita comprender el "por qué" de los estados del sistema, especialmente los inesperados. Piensa en la monitorización como mirar un cuadro de mandos, mientras que la observabilidad es tener las herramientas para investigar cualquier anomalía mostrada en ese cuadro de mandos o en cualquier otro lugar.
Implementar la observabilidad a menudo implica integrar varias herramientas. Las plataformas de propósito general como Datadog, Grafana y Prometheus se utilizan ampliamente para recopilar y visualizar métricas y registros. Estándares como OpenTelemetry ayudan a instrumentar las aplicaciones para generar datos de rastreo. En el espacio ML, plataformas como Weights & BiasesMLflow y Ultralytics HUB ofrecen funciones especializadas para el seguimiento de experimentos, la supervisión del rendimiento de los modelos y la gestión del ciclo de vida del ML, incorporando principios clave de observabilidad para la supervisión y el mantenimiento de los modelos.