Entdecke, wie Beobachtbarkeit KI/ML-Systeme wie Ultralytics YOLO verbessert. Gewinnen Sie Erkenntnisse, optimieren Sie die Leistung und stellen Sie die Zuverlässigkeit in realen Anwendungen sicher.
Die Beobachtbarkeit liefert entscheidende Einblicke in das Verhalten und die Leistung komplexer Systeme, was besonders im dynamischen Bereich der Künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) wichtig ist. Für Nutzer, die mit anspruchsvollen Modellen wie Ultralytics YOLOarbeiten, ist das Verständnis des internen Zustands der eingesetzten Anwendungen anhand ihrer externen Ergebnisse der Schlüssel zur Aufrechterhaltung der Zuverlässigkeit, zur Optimierung der Leistung und zur Gewährleistung der Vertrauenswürdigkeit in realen Anwendungen. Es hilft, die Lücke zwischen der Modellentwicklung und dem operativen Erfolg zu schließen.
Beobachtbarkeit ist die Fähigkeit, die internen Zustände eines Systems zu messen und zu verstehen, indem man seine Ausgaben wie Logs, Metriken und Traces untersucht. Im Gegensatz zur traditionellen Überwachung, die sich in der Regel auf vordefinierte Dashboards und bekannte Fehlermodi (z. B., CPU (z. B. CPU-Auslastung, Fehlerraten) konzentriert, versetzt die Beobachtbarkeit die Teams in die Lage, das Systemverhalten proaktiv zu untersuchen und neue Probleme zu diagnostizieren - auch solche, die während der Entwicklung nicht vorhergesehen wurden. Im Kontext von MLOps (Machine Learning Operations) ermöglicht sie es, tiefer gehende Fragen zu stellen, warum sich ein System auf eine bestimmte Weise verhält, was für die iterative Entwicklung und den Einsatz von ML-Modellen entscheidend ist. Es geht darum, Einblicke in komplexe Systeme zu bekommen, auch in Deep-Learning-Modelle.
Die Komplexität und die häufige "Blackbox"-Natur von Deep-Learning-Modellen machen die Beobachtbarkeit unerlässlich. Die wichtigsten Gründe dafür sind:
Beobachtbarkeit und Überwachung sind zwar verwandt, unterscheiden sich aber in Umfang und Zweck. Bei der Überwachung geht es darum, Daten über vordefinierte Kennzahlen zu sammeln und zu analysieren, um den Zustand des Systems anhand bekannter Benchmarks zu verfolgen (z. B. die mAP-Punktzahl eines eingesetzten Objekterkennungsmodells ). Sie beantwortet Fragen wie "Ist das System in Betrieb?" oder "Liegt die Fehlerrate unter X?". Die Modellüberwachung ist eine spezielle Art der Überwachung, die sich auf ML-Modelle in der Produktion konzentriert.
Observability hingegen nutzt die Datenausgaben (Logs, Metriken, Traces - oft als die"drei Säulen der Observability" bezeichnet), um tiefergehende, explorative Analysen zu ermöglichen. Sie ermöglicht es dir, das "Warum" hinter den Systemzuständen zu verstehen, insbesondere unerwartete Zustände. Stell dir vor, dass du bei der Überwachung auf ein Dashboard schaust, das bekannte Probleme meldet, während die Beobachtbarkeit die Werkzeuge (wie die Abfrage von Protokollen oder die Verfolgung von Anfragen) bereitstellt, um jede bekannte oder unbekannte Anomalie zu untersuchen. Das erleichtert die Fehlersuche in komplexen Systemen.
Die Beobachtbarkeit beruht auf drei Hauptarten von Telemetriedaten:
Beobachtungspraktiken sind bei anspruchsvollen KI/ML-Einsätzen unerlässlich:
Für die Umsetzung der Beobachtbarkeit sind oft spezielle Tools und Plattformen erforderlich. Beliebt sind Open-Source-Lösungen wie Prometheus (Metriken), Grafana (Visualisierung), Loki (Logs) und Jaeger oder Zipkin (Tracing). OpenTelemetry bietet einen herstellerneutralen Standard für die Instrumentierung. Kommerzielle Plattformen wie Datadog, New Relic und Dynatrace bieten integrierte Lösungen an. MLOps-Plattformen wie MLflow, Weights & Biasesund ClearML enthalten oft Funktionen zur Verfolgung von Experimenten und zur Überwachung von Modellen und tragen so zur Beobachtbarkeit des gesamten Systems bei. Ultralytics HUB erleichtert die Verwaltung von Trainingsläufen, Datensätzen und eingesetzten Modellen und lässt sich mit Tools wie TensorBoard zur Visualisierung von Metriken integrieren, was ein wichtiger Aspekt der Beobachtbarkeit während der Modelltrainingsphase ist.