Glosario

Observabilidad

Descubre cómo la observabilidad mejora los sistemas de IA/ML como Ultralytics YOLO . Obtén información, optimiza el rendimiento y garantiza la fiabilidad en aplicaciones del mundo real.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La observabilidad proporciona conocimientos críticos sobre el comportamiento y el rendimiento de sistemas complejos, especialmente vitales en el dinámico campo de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM). Para los usuarios que trabajan con modelos sofisticados como Ultralytics YOLO, comprender el estado interno de las aplicaciones desplegadas a través de sus salidas externas es clave para mantener la fiabilidad, optimizar el rendimiento y garantizar la fiabilidad.

¿Qué es la observabilidad?

La observabilidad es la capacidad de medir y comprender los estados internos de un sistema examinando sus salidas, como registros, métricas y trazas. A diferencia de la monitorización tradicional, que suele centrarse en cuadros de mando predefinidos y modos de fallo conocidos (por ejemplo, uso de CPU , tasas de error), la observabilidad equipa a los equipos para explorar proactivamente el comportamiento del sistema y diagnosticar problemas novedosos, incluso los no previstos durante el desarrollo. En el contexto de MLOps, permite plantear preguntas más profundas sobre por qué un sistema se comporta de una determinada manera, lo que es crucial para la naturaleza iterativa del desarrollo y despliegue de modelos ML.

¿Por qué es importante la observabilidad en la IA/ML?

La complejidad y la naturaleza a menudo de "caja negra" de los modelos de aprendizaje profundo hacen que la observabilidad sea indispensable. Entre las razones clave se incluyen:

  • Depuración de problemas complejos: Identificar la causa raíz de sutiles degradaciones de rendimiento o predicciones inesperadas en modelos como Ultralytics YOLOv8.
  • Detección de la Deriva de Datos y Conceptos: Supervisar las entradas y salidas del modelo para detectar cambios en la distribución de los datos(Deriva de Datos) o cambios en los conceptos subyacentes que aprendió el modelo, que pueden degradar la precisión.
  • Optimización del rendimiento: Comprender los cuellos de botella en el proceso de inferencia o la utilización de recursos durante el entrenamiento y la inferencia.
  • Garantizar la fiabilidad y robustez: Validar continuamente que los modelos funcionan como se espera en entornos de producción, algo crucial para aplicaciones en vehículos autónomos o análisis de imágenes médicas.
  • Crear confianza y explicabilidad: Aportando conocimientos sobre el comportamiento de los modelos, contribuyendo a los esfuerzos de la IA Explicable (XAI).

Observabilidad vs. Supervisión

Aunque están relacionadas, la observabilidad y la supervisión difieren en su alcance y finalidad. La monitorización implica recopilar y analizar datos sobre métricas predefinidas para realizar un seguimiento del estado del sistema en comparación con puntos de referencia conocidos. La observabilidad, sin embargo, utiliza las salidas de datos (registros, métricas, trazas -a menudo denominados los"tres pilares de la observabilidad"-) para permitir un análisis exploratorio más profundo, que te permita comprender el "por qué" de los estados del sistema, especialmente los inesperados. Piensa en la monitorización como mirar un cuadro de mandos, mientras que la observabilidad es tener las herramientas para investigar cualquier anomalía mostrada en ese cuadro de mandos o en cualquier otro lugar.

Aplicaciones en el mundo real

  1. Diagnóstico de fallos en la detección de objetos: Un modelo de detección de objetos desplegado para la supervisión de estanterías minoristas mediante Ultralytics YOLO11 de repente empiezan a faltar artículos. Las herramientas de observabilidad correlacionan las métricas que muestran cambios en el brillo de la imagen (desviación de los datos de entrada) con los registros que indican puntuaciones de confianza más bajas, señalando los cambios ambientales (por ejemplo, nueva iluminación de la tienda) como la causa, guiando las estrategias de reentrenamiento o aumento de datos.
  2. Mejora de los sistemas de recomendación: Un servicio de streaming utiliza la observabilidad para rastrear las peticiones de los usuarios a través de su motor de recomendación. Observan un aumento de la latencia (métrica) en determinados segmentos de usuarios. Las trazas revelan un cuello de botella en un microservicio específico durante la recuperación de características. Los registros confirman tasas de error más elevadas para este servicio, lo que orienta los esfuerzos de optimización para mejorar la experiencia del usuario.

Herramientas y plataformas

Implementar la observabilidad a menudo implica integrar varias herramientas. Las plataformas de propósito general como Datadog, Grafana y Prometheus se utilizan ampliamente para recopilar y visualizar métricas y registros. Estándares como OpenTelemetry ayudan a instrumentar las aplicaciones para generar datos de rastreo. En el espacio ML, plataformas como Weights & BiasesMLflow y Ultralytics HUB ofrecen funciones especializadas para el seguimiento de experimentos, la supervisión del rendimiento de los modelos y la gestión del ciclo de vida del ML, incorporando principios clave de observabilidad para la supervisión y el mantenimiento de los modelos.

Leer todo