Glossar

Genauigkeit

Erfahre, wie wichtig die Genauigkeit beim maschinellen Lernen ist, wie sie berechnet wird, wo die Grenzen bei unausgewogenen Datensätzen liegen und wie du die Modellleistung verbessern kannst.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Genauigkeit ist eine grundlegende Leistungskennzahl beim maschinellen Lernen (ML), insbesondere bei Klassifizierungsaufgaben. Sie misst den Anteil der gesamten Vorhersagen, die ein Modell richtig erkannt hat. Einfach ausgedrückt, beantwortet sie die Frage: "Wie viele der getroffenen Vorhersagen waren tatsächlich richtig?" Sie gibt einen einfachen Überblick über die Gesamtleistung eines Modells in einem bestimmten Datensatz.

Verstehen der Genauigkeit

Die Genauigkeit wird berechnet, indem die Anzahl der richtigen Vorhersagen (sowohl wahr-positive als auch wahr-negative) durch die Gesamtzahl der getroffenen Vorhersagen geteilt wird. Obwohl sie intuitiv ist, kann die Genauigkeit allein manchmal irreführend sein, vor allem bei unausgewogenen Datensätzen - also in Situationen, in denen eine Klasse deutlich in der Überzahl ist. Wenn ein Datensatz zum Beispiel 95 % Nicht-Spam-E-Mails und 5 % Spam-E-Mails enthält, würde ein Modell, das einfach für jede E-Mail "kein Spam" vorhersagt, eine Genauigkeit von 95 % erreichen, obwohl es für die Identifizierung von tatsächlichem Spam nutzlos ist. Deshalb ist es wichtig, die Genauigkeit zusammen mit anderen Bewertungskriterien zu betrachten, um ein vollständiges Bild der Modellleistung zu erhalten. Hier erhältst du weitere Einblicke in die Modellbewertung und die Strategien zur Feinabstimmung.

Genauigkeit vs. andere Metriken

Es ist wichtig, die Genauigkeit von verwandten Kennzahlen zu unterscheiden:

  • Präzision: Misst den Anteil der positiven Identifizierungen, die tatsächlich richtig waren. Sie beantwortet: "Wie viele der als positiv vorhergesagten Elemente waren tatsächlich positiv?" Eine hohe Genauigkeit ist entscheidend, wenn die Kosten eines falschen Positivs hoch sind.
  • Recall (Sensitivität): Misst den Anteil der tatsächlich positiven Ergebnisse, die richtig erkannt wurden. Sie beantwortet: "Wie viele der tatsächlich positiven Fälle hat das Modell richtig erkannt?" Eine hohe Rückrufquote ist wichtig, wenn das Übersehen eines positiven Falls (falsch negativ) teuer ist.
  • F1-Score: Das harmonische Mittel aus Precision und Recall, das einen einzigen Wert liefert, der beide Messgrößen ausgleicht. Er ist besonders nützlich, wenn es um unausgewogene Klassen geht.
  • Mittlere durchschnittliche Genauigkeit (mAP): Eine gängige Metrik bei Aufgaben zur Objekterkennung, wie sie von Ultralytics YOLO Modellen, die sowohl die Korrektheit der Klassifizierung als auch die Lokalisierungsgenauigkeit(Intersection over Union - IoU) berücksichtigen. Die einfache Genauigkeit ist hier nicht geeignet, da sie die Platzierung der Bounding Box nicht berücksichtigt.

Diese Kennzahlen werden oft von einer Konfusionsmatrix abgeleitet, die eine detaillierte Aufschlüsselung der richtigen und falschen Klassifizierungen für jede Klasse enthält. Es ist wichtig, diese YOLO zu verstehen.

Anwendungen und Beispiele aus der realen Welt

Die Genauigkeit dient in vielen Anwendungen als Basismaßstab:

  1. Spam-E-Mail-Filterung: Bei der Klassifizierung von E-Mails als "Spam" oder "kein Spam" gibt die Genauigkeit den Gesamtprozentsatz der richtig kategorisierten E-Mails an. Aufgrund des typischerweise geringen Anteils an Spam-E-Mails(ein Problem der unausgewogenen Datenmenge) kann es jedoch trügerisch sein, sich nur auf die Genauigkeit zu verlassen. Metriken wie Präzision und Recall sind hier oft aussagekräftiger, um sicherzustellen, dass Spam erkannt wird, ohne dass legitime E-Mails falsch gekennzeichnet werden.
  2. Medizinische Bildanalyse: Nehmen wir an, ein KI-Modell im Gesundheitswesen soll medizinische Scans so klassifizieren, dass sie einen Tumor zeigen ("positiv") oder nicht ("negativ"). Während die Gesamtgenauigkeit wichtig ist, ist die Wiedererkennung von entscheidender Bedeutung. Einen Tumor zu übersehen (ein falsches Negativ) kann schwerwiegende Folgen haben. Daher ist es von größter Bedeutung, dass das Modell so viele tatsächliche Tumorfälle wie möglich identifiziert, auch wenn dies eine geringere Genauigkeit bedeutet (mehr falsch positive Ergebnisse, die eine weitere Überprüfung erfordern). Plattformen wie Ultralytics HUB können dabei helfen, den Trainings- und Bewertungsprozess für solche Modelle zu verwalten.

Genauigkeit in der Ultralytics

Innerhalb des Ultralytics ist die Genauigkeit eine von mehreren Kennzahlen, die zur Bewertung der Modellleistung verwendet werden, insbesondere bei Bildklassifizierungsaufgaben. Beim Vergleich von Modellen, z. B. YOLO11 vs. YOLOv8, liefern Genauigkeitsbenchmarks auf Standarddatensätzen wie ImageNet wertvolle Vergleichspunkte, neben der Inferenzgeschwindigkeit und den Rechenkosten. Für Erkennungs- und Segmentierungsaufgaben werden jedoch Metriken wie mAP bevorzugt, da sie die besonderen Herausforderungen dieser Aufgaben besser widerspiegeln.

Alles lesen