Glossar

Beobachtbarkeit

Entdecke, wie Beobachtbarkeit KI/ML-Systeme wie Ultralytics YOLO verbessert. Gewinnen Sie Erkenntnisse, optimieren Sie die Leistung und stellen Sie die Zuverlässigkeit in realen Anwendungen sicher.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Beobachtbarkeit liefert entscheidende Einblicke in das Verhalten und die Leistung komplexer Systeme, was besonders im dynamischen Bereich der Künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) wichtig ist. Für Nutzer, die mit anspruchsvollen Modellen wie Ultralytics YOLOarbeiten, ist das Verständnis des internen Zustands der eingesetzten Anwendungen anhand ihrer externen Ergebnisse der Schlüssel zur Aufrechterhaltung der Zuverlässigkeit, zur Optimierung der Leistung und zur Gewährleistung der Vertrauenswürdigkeit in realen Anwendungen. Es hilft, die Lücke zwischen der Modellentwicklung und dem operativen Erfolg zu schließen.

Was ist Beobachtbarkeit?

Beobachtbarkeit ist die Fähigkeit, die internen Zustände eines Systems zu messen und zu verstehen, indem man seine Ausgaben wie Logs, Metriken und Traces untersucht. Im Gegensatz zur traditionellen Überwachung, die sich in der Regel auf vordefinierte Dashboards und bekannte Fehlermodi (z. B., CPU (z. B. CPU-Auslastung, Fehlerraten) konzentriert, versetzt die Beobachtbarkeit die Teams in die Lage, das Systemverhalten proaktiv zu untersuchen und neue Probleme zu diagnostizieren - auch solche, die während der Entwicklung nicht vorhergesehen wurden. Im Kontext von MLOps (Machine Learning Operations) ermöglicht sie es, tiefer gehende Fragen zu stellen, warum sich ein System auf eine bestimmte Weise verhält, was für die iterative Entwicklung und den Einsatz von ML-Modellen entscheidend ist. Es geht darum, Einblicke in komplexe Systeme zu bekommen, auch in Deep-Learning-Modelle.

Warum ist Beobachtbarkeit in der KI/ML wichtig?

Die Komplexität und die häufige "Blackbox"-Natur von Deep-Learning-Modellen machen die Beobachtbarkeit unerlässlich. Die wichtigsten Gründe dafür sind:

  • Leistungsoptimierung: Identifizierung von Engpässen in der Inferenzpipeline oder beim verteilten Training, Optimierung der Ressourcennutzung (GPU) und die Verbesserung von Metriken wie der Inferenzlatenz.
  • Verlässlichkeit und Fehlersuche: Schnelles Erkennen und Diagnostizieren von Problemen wie Datendrift, Modellverschlechterung im Laufe der Zeit oder unerwartetes Verhalten aufgrund von Grenzfällen in den Eingabedaten. Das hilft, die Genauigkeit und Robustheit des Modells zu erhalten.
  • Vertrauen und Erklärbarkeit: Einblicke in die Vorhersagen und das Verhalten von Modellen gewähren, die Bemühungen um erklärbare KI (XAI) unterstützen und das Vertrauen der Nutzerinnen und Nutzer stärken, insbesondere bei kritischen Anwendungen wie autonomen Fahrzeugen oder im Gesundheitswesen.
  • Compliance und Governance: Sicherstellen, dass die Modelle innerhalb definierter ethischer Grenzen arbeiten(KI-Ethik) und regulatorische Anforderungen erfüllen, indem Entscheidungen protokolliert und auf algorithmische Verzerrungen überwacht werden. Transparenz in der KI ist ein wichtiger Vorteil.

Beobachtbarkeit vs. Überwachung

Beobachtbarkeit und Überwachung sind zwar verwandt, unterscheiden sich aber in Umfang und Zweck. Bei der Überwachung geht es darum, Daten über vordefinierte Kennzahlen zu sammeln und zu analysieren, um den Zustand des Systems anhand bekannter Benchmarks zu verfolgen (z. B. die mAP-Punktzahl eines eingesetzten Objekterkennungsmodells ). Sie beantwortet Fragen wie "Ist das System in Betrieb?" oder "Liegt die Fehlerrate unter X?". Die Modellüberwachung ist eine spezielle Art der Überwachung, die sich auf ML-Modelle in der Produktion konzentriert.

Observability hingegen nutzt die Datenausgaben (Logs, Metriken, Traces - oft als die"drei Säulen der Observability" bezeichnet), um tiefergehende, explorative Analysen zu ermöglichen. Sie ermöglicht es dir, das "Warum" hinter den Systemzuständen zu verstehen, insbesondere unerwartete Zustände. Stell dir vor, dass du bei der Überwachung auf ein Dashboard schaust, das bekannte Probleme meldet, während die Beobachtbarkeit die Werkzeuge (wie die Abfrage von Protokollen oder die Verfolgung von Anfragen) bereitstellt, um jede bekannte oder unbekannte Anomalie zu untersuchen. Das erleichtert die Fehlersuche in komplexen Systemen.

Schlüsselkomponenten (Die drei Säulen)

Die Beobachtbarkeit beruht auf drei Hauptarten von Telemetriedaten:

  1. Logs: Mit einem Zeitstempel versehene Aufzeichnungen von einzelnen Ereignissen, die im System auftreten. Logs liefern detaillierte, kontextbezogene Informationen, die für die Fehlersuche bei bestimmten Vorfällen oder das Verständnis von Betriebsabläufen nützlich sind. Beispiele sind Fehlermeldungen, Anwendungsereignisse oder Anfragedetails.
  2. Metriken: Numerische Darstellungen der Systemleistung oder des Systemverhaltens, die in bestimmten Zeitabständen gemessen werden. Metriken sind aggregierbar und effizient, um Trends zu verfolgen, Alarme zu setzen und den Gesamtzustand des Systems zu verstehen (z. B. Anfragelatenz, Fehlerrate, Ressourcenauslastung).
  3. Traces: Aufzeichnungen, die den Weg einer Anfrage oder Operation durch die verschiedenen Komponenten eines verteilten Systems zeigen. Traces helfen dabei, den Fluss zu visualisieren, Leistungsengpässe zu identifizieren und Abhängigkeiten zwischen Diensten zu verstehen, was für Microservices-Architekturen oder komplexe ML-Pipelines entscheidend ist.

Anwendungen in der realen Welt

Beobachtungspraktiken sind bei anspruchsvollen KI/ML-Einsätzen unerlässlich:

  • Autonome Fahrsysteme: Bei KI-Lösungen für das Auto ist die Beobachtbarkeit entscheidend. Protokolle von Sensoren (z. B. LiDAR, Kameras), Metriken zur Geschwindigkeit des Wahrnehmungsmodells und Spuren, die den Entscheidungsprozess von der Wahrnehmung bis zur Steuerung verfolgen, werden ständig analysiert. Dies hilft Ingenieuren bei Unternehmen wie Waymo, seltene Fehler zu diagnostizieren (z. B. die falsche Erkennung eines Objekts unter bestimmten Wetterbedingungen) und die Sicherheit und Zuverlässigkeit des Systems zu gewährleisten.
  • Medizinische Bildanalyse: Beim Einsatz von KI für die medizinische Bildanalyse hilft die Beobachtbarkeit, die diagnostische Qualität sicherzustellen. Metriken zeigen den Konfidenzwert des Modells und die Übereinstimmungsrate mit Radiologen. Protokolle zeichnen Grenzfälle oder Bilder auf, die zur Überprüfung markiert wurden. Traces können ein Bild von der Aufnahme über die Vorverarbeitung, die Schlussfolgerungen und die Berichterstattung verfolgen und helfen so, Fehlerquellen oder Verzögerungen zu erkennen und die Einhaltung von Vorschriften im Gesundheitswesen zu gewährleisten(KI-Forschung in der Radiologie).

Tools und Plattformen

Für die Umsetzung der Beobachtbarkeit sind oft spezielle Tools und Plattformen erforderlich. Beliebt sind Open-Source-Lösungen wie Prometheus (Metriken), Grafana (Visualisierung), Loki (Logs) und Jaeger oder Zipkin (Tracing). OpenTelemetry bietet einen herstellerneutralen Standard für die Instrumentierung. Kommerzielle Plattformen wie Datadog, New Relic und Dynatrace bieten integrierte Lösungen an. MLOps-Plattformen wie MLflow, Weights & Biasesund ClearML enthalten oft Funktionen zur Verfolgung von Experimenten und zur Überwachung von Modellen und tragen so zur Beobachtbarkeit des gesamten Systems bei. Ultralytics HUB erleichtert die Verwaltung von Trainingsläufen, Datensätzen und eingesetzten Modellen und lässt sich mit Tools wie TensorBoard zur Visualisierung von Metriken integrieren, was ein wichtiger Aspekt der Beobachtbarkeit während der Modelltrainingsphase ist.

Alles lesen