통합 가시성이 어떻게 AI/ML 시스템을 향상시키는지 알아보세요 Ultralytics YOLO . 실제 애플리케이션에서 인사이트를 얻고, 성능을 최적화하고, 안정성을 보장하세요.
관찰 가능성은 복잡한 시스템의 동작과 성능에 대한 중요한 인사이트를 제공하며, 특히 인공 지능(AI) 과 머신 러닝(ML)의 역동적인 분야에서 매우 중요합니다. 다음과 같은 정교한 모델로 작업하는 사용자에게 적합합니다. Ultralytics YOLO와 같은 정교한 모델을 사용하는 사용자에게는 외부 출력을 통해 배포된 애플리케이션의 내부 상태를 이해하는 것이 실제 애플리케이션에서 안정성을 유지하고 성능을 최적화하며 신뢰성을 보장하는 데 핵심입니다. 이는 모델 개발과 운영 성공 사이의 격차를 해소하는 데 도움이 됩니다.
통합 가시성이란 로그, 메트릭, 추적 등의 출력을 검토하여 시스템의 내부 상태를 측정하고 이해하는 기능입니다. 일반적으로 사전 정의된 대시보드와 알려진 장애 모드(예, CPU 사용량, 오류율 등)에 초점을 맞춘 기존의 모니터링과 달리, 통합 가시성을 통해 팀은 시스템 동작을 사전에 탐색하고 개발 중에 예상하지 못한 새로운 문제까지 진단할 수 있습니다. 머신 러닝 운영(MLOps)의 맥락에서는 시스템이 특정 방식으로 작동하는 이유에 대해 더 심층적인 질문을 할 수 있으며, 이는 ML 모델 개발 및 배포의 반복적인 특성에 매우 중요합니다. 이는 딥 러닝 모델을 포함한 복잡한 시스템에 대한 가시성을 확보하는 것입니다.
딥 러닝 모델의 복잡성과 종종 '블랙박스' 같은 특성으로 인해 관찰 기능은 필수 불가결한 요소입니다. 주요 이유는 다음과 같습니다:
통합 가시성과 모니터링은 서로 연관되어 있지만 범위와 목적이 다릅니다. 모니터링은 사전 정의된 메트릭에 대한 데이터를 수집하고 분석하여 알려진 벤치마크(예: 배포된 개체 탐지 모델의 mAP 점수 추적)와 비교하여 시스템 상태를 추적하는 것을 포함합니다. "시스템이 가동 중인가?" 또는 "오류율이 X 이하인가?"와 같은 질문에 답합니다. 모델 모니터링은 프로덕션 환경의 ML 모델에 초점을 맞춘 특정 유형의 모니터링입니다.
그러나 통합 가시성은 데이터 출력(로그, 메트릭, 추적 - 흔히"통합 가시성의 세 가지 기둥"이라고 함)을 사용하여 보다 심층적이고 탐색적인 분석을 가능하게 합니다. 이를 통해 시스템 상태, 특히 예상치 못한 상태의 '이유'를 이해할 수 있습니다. 모니터링을 알려진 문제를 보고하는 대시보드를 보는 것으로 생각하면, 통합 가시성은 로그 쿼리 또는 요청 추적과 같은 도구를 통해 알려진 이상 징후를 조사할 수 있는 도구를 제공합니다(예: 로그 쿼리 또는 요청 추적). 복잡한 시스템을 쉽게 디버깅할 수 있습니다.
관찰 가능성은 세 가지 주요 유형의 원격 분석 데이터에 의존합니다:
통합 가시성 관행은 정교한 AI/ML 배포에서 매우 중요합니다:
통합 가시성을 구현하려면 종종 전문화된 도구와 플랫폼이 필요합니다. Prometheus (메트릭), Grafana (시각화), Loki (로그), Jaeger 또는 Zipkin (추적)과 같은 오픈 소스 솔루션이 널리 사용됩니다. OpenTelemetry는 공급업체 중립적인 계측 표준을 제공합니다. Datadog, New Relic, Dynatrace와 같은 상용 플랫폼은 통합 솔루션을 제공합니다. MLflow와 같은 MLOps 플랫폼, Weights & Biases및 ClearML 과 같은 MLOps 플랫폼에는 실험을 추적하고 모델을 모니터링하는 기능이 포함되어 있어 전반적인 시스템 통합 가시성에 기여하는 경우가 많습니다. Ultralytics HUB는 훈련 실행, 데이터 세트 및 배포된 모델을 쉽게 관리할 수 있게 해주며, 모델 훈련 단계에서 통합 가시성의 핵심 요소인 메트릭을 시각화하기 위해 TensorBoard와 같은 도구와 통합됩니다.