Glossário

Observabilidade

Descobre como a observabilidade melhora os sistemas de IA/ML como Ultralytics YOLO . Obtém informações, optimiza o desempenho e garante a fiabilidade em aplicações do mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A observabilidade fornece informações críticas sobre o comportamento e o desempenho de sistemas complexos, particularmente vitais no campo dinâmico da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML). Para os utilizadores que trabalham com modelos sofisticados como o Ultralytics YOLO, compreender o estado interno das aplicações implementadas através dos seus resultados externos é fundamental para manter a fiabilidade, otimizar o desempenho e garantir a fiabilidade.

O que é a observabilidade?

A observabilidade é a capacidade de medir e compreender os estados internos de um sistema, examinando os seus resultados, como registos, métricas e traços. Ao contrário da monitorização tradicional, que normalmente se concentra em dashboards predefinidos e modos de falha conhecidos (por exemplo, utilização CPU , taxas de erro), a observabilidade equipa as equipas para explorar proactivamente o comportamento do sistema e diagnosticar novos problemas - mesmo aqueles que não foram previstos durante o desenvolvimento. No contexto do MLOps, permite fazer perguntas mais profundas sobre por que um sistema está se comportando de uma determinada maneira, o que é crucial para a natureza iterativa do desenvolvimento e implantação do modelo de ML.

Porque é que a observabilidade é importante na IA/ML?

A complexidade e a natureza frequentemente "caixa negra" dos modelos de aprendizagem profunda tornam a observabilidade indispensável. As principais razões incluem:

  • Depuração de problemas complexos: Identificar a causa raiz de degradações subtis do desempenho ou previsões inesperadas em modelos como o Ultralytics YOLOv8.
  • Detetar a deriva de dados e conceitos: Monitorizar as entradas e saídas do modelo para detetar mudanças na distribuição dos dados(Data Drift) ou mudanças nos conceitos subjacentes que o modelo aprendeu, o que pode diminuir a precisão.
  • Otimização do desempenho: Compreende os estrangulamentos no pipeline de inferência ou a utilização de recursos durante a formação e a inferência.
  • Garante a fiabilidade e a robustez: Validar continuamente que os modelos funcionam como esperado em ambientes de produção, crucial para aplicações em veículos autónomos ou análise de imagens médicas.
  • Criar confiança e explicabilidade: Fornece informações sobre o comportamento do modelo, contribuindo para os esforços de IA explicável (XAI).

Observabilidade vs. Monitorização

Embora relacionadas, a observabilidade e a monitorização diferem em termos de âmbito e objetivo. A monitorização envolve a recolha e a análise de dados sobre métricas predefinidas para acompanhar a saúde do sistema em relação a parâmetros de referência conhecidos. A observabilidade, no entanto, utiliza as saídas de dados (registos, métricas, traços - muitas vezes chamados os"três pilares da observabilidade") para permitir uma análise mais profunda e exploratória, permitindo-lhe compreender o "porquê" por detrás dos estados do sistema, especialmente os inesperados. Pensa na monitorização como olhar para um painel de instrumentos, enquanto a observabilidade é ter as ferramentas para investigar qualquer anomalia apresentada nesse painel ou noutro local.

Aplicações no mundo real

  1. Diagnosticar falhas na deteção de objectos: Um modelo de deteção de objectos implementado para a monitorização de prateleiras de retalho utilizando Ultralytics YOLO11 começa subitamente a perder objectos. As ferramentas de observabilidade correlacionam métricas que mostram alterações no brilho da imagem (desvio de dados de entrada) com registos que indicam pontuações de confiança mais baixas, identificando alterações ambientais (por exemplo, nova iluminação da loja) como a causa, orientando estratégias de reciclagem ou de aumento de dados.
  2. Melhoria dos sistemas de recomendação: Um serviço de streaming utiliza a observabilidade para rastrear os pedidos dos utilizadores através do seu motor de recomendação. Nota um aumento da latência (métrica) para determinados segmentos de utilizadores. Os rastreamentos revelam um gargalo em um microsserviço específico durante a recuperação de recursos. Os registos confirmam taxas de erro mais elevadas para este serviço, orientando os esforços de otimização direcionados para melhorar a experiência do utilizador.

Ferramentas e plataformas

A implementação da observabilidade geralmente envolve a integração de várias ferramentas. Plataformas de uso geral como Datadog, Grafana e Prometheus são amplamente usadas para coletar e visualizar métricas e logs. Padrões como o OpenTelemetry ajudam as aplicações de instrumentos a gerar dados de rastreamento. No espaço de ML, plataformas como Weights & BiasesMLflow e Ultralytics HUB fornecem recursos especializados para rastrear experimentos, monitorar o desempenho do modelo e gerenciar o ciclo de vida do ML, incorporando os principais princípios de observabilidade para monitoramento e manutenção do modelo.

Lê tudo