Glossar

Fläche unter der Kurve (AUC)

Entdecke die AUC, eine wichtige Kennzahl beim maschinellen Lernen, die die Leistung von Modellen bewertet, ihre Verbindung zu ROC-Kurven und reale Anwendungen in der KI.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Fläche unter der Kurve (Area Under the Curve, AUC) ist eine weit verbreitete Kennzahl beim maschinellen Lernen, insbesondere bei binären Klassifikationsproblemen, um die Leistung eines Modells zu bewerten. Sie stellt den Grad oder das Maß der Trennbarkeit dar und zeigt die Fähigkeit des Modells an, zwischen den Klassen zu unterscheiden. AUC liegt zwischen 0 und 1, wobei ein höherer Wert für eine bessere Modellleistung steht. Ein Modell mit einem AUC von 1 bedeutet eine perfekte Klassifizierung, während ein AUC von 0,5 darauf hindeutet, dass das Modell nicht besser ist als zufälliges Raten.

AUC und ROC-Kurve verstehen

Der AUC ist eng mit der Receiver Operating Characteristic (ROC) Kurve verbunden. Die ROC-Kurve ist eine grafische Darstellung der Leistung eines Modells, in der die Rate der echten Positiven (TPR) gegen die Rate der falschen Positiven (FPR) bei verschiedenen Schwellenwerten aufgetragen wird. Die TPR, die auch als Recall bezeichnet wird, misst den Anteil der tatsächlichen Positivmeldungen, während die FPR den Anteil der tatsächlichen Negativmeldungen misst, die fälschlicherweise als Positivmeldungen eingestuft werden. Der AUC ist, wie der Name schon sagt, die Fläche unter der ROC-Kurve und fasst die Leistung des Modells über alle möglichen Schwellenwerte hinweg in einem einzigen skalaren Wert zusammen.

Die Bedeutung von AUC

Der AUC ist aus mehreren Gründen eine wichtige Kennzahl. Erstens ist er schwellenunabhängig, d. h. er misst die Qualität der Vorhersagen des Modells unabhängig davon, welche Klassifizierungsschwelle gewählt wird. Dies ist besonders nützlich, wenn die Kosten für falsch-positive und falsch-negative Ergebnisse variieren oder wenn es um unausgewogene Datensätze geht. Zweitens gibt der AUC einen umfassenden Überblick über die Leistung des Modells bei allen möglichen Klassifizierungsschwellenwerten und bietet damit ein differenzierteres Verständnis als Kennzahlen wie die Genauigkeit, die in unausgewogenen Szenarien irreführend sein können.

Anwendungen von AUC

AUC wird in verschiedenen realen Anwendungen eingesetzt, um die Leistung verschiedener Machine-Learning-Modelle zu bewerten und zu vergleichen. Hier sind zwei konkrete Beispiele:

  1. Medizinische Diagnose: In der medizinischen Diagnose kann die AUC verwendet werden, um die Leistung von Modellen zu bewerten, die das Vorhandensein oder Nichtvorhandensein einer Krankheit vorhersagen sollen. Ein Modell, das anhand bestimmter Biomarker vorhersagt, ob ein Patient an einer bestimmten Krankheit leidet, kann zum Beispiel mit Hilfe der AUC bewertet werden. Ein höherer AUC zeigt an, dass das Modell besser zwischen Patienten mit und ohne die Krankheit unterscheiden kann, unabhängig vom gewählten Schwellenwert für die Diagnose. Erfahre mehr über KI im Gesundheitswesen.
  2. Betrugsaufdeckung: In der Finanzbranche wird die AUC verwendet, um die Leistung von Betrugserkennungsmodellen zu bewerten. Diese Modelle zielen darauf ab, betrügerische Transaktionen auf der Grundlage verschiedener Merkmale zu erkennen. Ein hoher AUC deutet darauf hin, dass das Modell effektiv zwischen legitimen und betrügerischen Transaktionen unterscheiden kann und sowohl falsch-positive (legitime Transaktionen, die als betrügerisch gekennzeichnet werden) als auch falsch-negative (betrügerische Transaktionen, die nicht erkannt werden) minimiert.

AUC vs. andere Metriken

Obwohl der AUC eine wertvolle Kennzahl ist, ist es wichtig zu verstehen, wie er sich von anderen Bewertungskennzahlen unterscheidet:

  • AUC vs. Genauigkeit: Die Genauigkeit misst die allgemeine Korrektheit der Vorhersagen eines Modells. In unausgewogenen Datensätzen kann sie jedoch irreführend sein. In einem Datensatz, in dem 95 % der Instanzen zur Klasse A und 5 % zur Klasse B gehören, hat ein Modell, das immer die Klasse A vorhersagt, zwar eine Genauigkeit von 95 %, ist aber nicht nützlich. Der AUC hingegen berücksichtigt die Fähigkeit des Modells, zwischen den Klassen zu unterscheiden, und ist daher in solchen Fällen eine zuverlässigere Kennzahl.
  • AUC vs. F1-Score: Der F1-Score ist der harmonische Mittelwert aus Precision und Recall und sorgt für ein Gleichgewicht zwischen diesen beiden Metriken. Im Gegensatz zum AUC wird der F1-Score bei einem bestimmten Schwellenwert berechnet. Während der F1-Score nützlich ist, wenn ein Gleichgewicht zwischen Präzision und Recall bei einem bestimmten Schwellenwert benötigt wird, bietet AUC einen umfassenderen Überblick über die Leistung des Modells über alle Schwellenwerte hinweg.

Schlussfolgerung

Der AUC ist eine leistungsstarke Kennzahl zur Bewertung der Leistung von Klassifizierungsmodellen, insbesondere in Szenarien mit unausgewogenen Datensätzen oder unterschiedlichen Kosten der Fehlklassifizierung. Seine Schwellenwertunabhängigkeit und seine umfassende Betrachtung aller möglichen Schwellenwerte machen ihn zu einem wertvollen Werkzeug für Praktiker des maschinellen Lernens. Das Verständnis der AUC, ihrer Beziehung zur ROC-Kurve und ihrer Anwendungen kann die Fähigkeit zur Entwicklung und Bewertung effektiver Machine-Learning-Modelle erheblich verbessern. Für diejenigen, die mit fortgeschrittenen Computer Vision Aufgaben arbeiten, bieten Frameworks wie Ultralytics YOLO robuste Werkzeuge für die Modellentwicklung und -bewertung, einschließlich Metriken wie AUC. Um mehr über KI und Computer Vision zu erfahren, besuche das Glossar aufUltralytics . Du kannst dich auch an der Entwicklung innovativer KI beteiligen, indem du dich auf Ultralytics über Karrieren informierst.

Alles lesen