Entdecke die Bedeutung des F1-Scores beim maschinellen Lernen! Erfahre, wie er Präzision und Recall für eine optimale Modellbewertung ausgleicht.
Der F1-Score ist eine weit verbreitete Kennzahl im maschinellen Lernen (ML) und in der statistischen Analyse, um die Leistung von binären oder Mehrklassen-Klassifikationsmodellen zu bewerten. Er bietet eine Möglichkeit, die Präzision und den Rückruf eines Modells in einer einzigen Kennzahl zu kombinieren und bietet so eine robustere Bewertung als die Genauigkeit allein, insbesondere bei unausgewogenen Datensätzen oder wenn die Kosten für falsch-positive und falsch-negative Ergebnisse sehr unterschiedlich sind.
Bevor du dich mit dem F1-Score beschäftigst, ist es wichtig, seine Bestandteile zu verstehen:
Diese Metriken werden anhand der Anzahl von True Positives (TP), False Positives (FP) und False Negatives (FN) berechnet, die aus einer Konfusionsmatrix abgeleitet werden.
Die Genauigkeit allein kann irreführend sein, insbesondere bei unausgewogenen Datensätzen. Wenn ein Datensatz zum Beispiel 95 % negative und 5 % positive Fälle enthält, erreicht ein Modell, das immer "negativ" vorhersagt, zwar eine Genauigkeit von 95 %, ist aber für die Identifizierung positiver Fälle nutzlos (null Rückruf).
Der F1-Score berücksichtigt dies, indem er den harmonischen Mittelwert von Precision und Recall berechnet. Das harmonische Mittel bestraft Extremwerte stärker als ein einfaches arithmetisches Mittel. Folglich erfordert ein hoher F1-Score sowohl eine hohe Präzision als auch einen hohen Recall, um ein Gleichgewicht zwischen den beiden Werten zu gewährleisten. Er reicht von 0 (schlechtester Wert) bis 1 (bester Wert).
Der F1-Score ist eine Standardbewertungsmetrik in vielen KI- und ML-Bereichen:
Die Wahl der richtigen Metrik hängt von der jeweiligen Problemstellung und der relativen Bedeutung der Minimierung von falsch-positiven gegenüber falsch-negativen Ergebnissen ab. Tools wie Ultralytics HUB ermöglichen es, während der Modellschulung und -bewertung mehrere Metriken, einschließlich des F1-Scores, zu verfolgen, um den Nutzern zu helfen, fundierte Entscheidungen zu treffen. In den Ultralytics findest du praktische Anleitungen zur Modellbewertung.