Erfahre, was Recall beim maschinellen Lernen ist, warum er wichtig ist und wie er sicherstellt, dass KI-Modelle kritische positive Instanzen effektiv erfassen.
Der Recall ist eine wichtige Leistungskennzahl beim maschinellen Lernen und in der Statistik, die insbesondere bei Klassifizierungs- und Information Retrieval-Aufgaben wichtig ist. Sie misst die Fähigkeit eines Modells, alle relevanten Instanzen eines Datensatzes korrekt zu identifizieren. Der Recall wird auch als Sensitivität oder True Positive Rate (TPR) bezeichnet und beantwortet die Frage: "Wie viele der tatsächlich positiven Instanzen hat das Modell korrekt als positiv vorhergesagt?" Eine hohe Rückrufquote ist in Szenarien entscheidend, in denen das Übersehen eines positiven Beispiels (ein falsches Negativ) erhebliche Folgen hat.
Der Recall konzentriert sich auf die tatsächlich positiven Fälle innerhalb eines Datensatzes und gibt an, wie viele davon erfolgreich vom Modell erfasst wurden. Sie wird berechnet als das Verhältnis von True Positives (TP) - richtig als positiv erkannte Fälle - zur Summe von True Positives und False Negatives (FN) - Fälle, die tatsächlich positiv waren, aber fälschlicherweise als negativ erkannt wurden. Ein Modell mit einem hohen Recall identifiziert die meisten positiven Instanzen korrekt. Der Recall ist wichtig für die Bewertung der Modellleistung, die oft mithilfe einer Konfusionsmatrix dargestellt wird.
Recall wird oft zusammen mit Precision diskutiert. Während Recall den Anteil der tatsächlich richtig identifizierten Positiven misst, misst Precision den Anteil der vorhergesagten Positiven, die tatsächlich richtig waren (TP / (TP + False Positives)). Oft gibt es einen Kompromiss zwischen Precision und Recall; eine Optimierung für das eine kann sich manchmal negativ auf das andere auswirken.Die Entscheidung, ob Recall oder Precision Priorität hat, hängt von der jeweiligen Anwendung ab:
Der F1-Score ist eine einzige Metrik, die sowohl Precision als auch Recall ausgleicht.
Die Rückrufquote ist in vielen Bereichen ein wichtiger Bewertungsmaßstab:
In der Computer Vision ist der Recall für die Bewertung von Aufgaben wie der Objekterkennung und der Bildsegmentierung unerlässlich. Für ein Objekterkennungsmodell wie Ultralytics YOLOgibt der Recall an, wie gut das Modell alle Instanzen einer bestimmten Objektklasse in einem Bild findet. Ein hoher Recall bedeutet, dass das Modell nur selten Objekte übersieht, die es eigentlich erkennen sollte. Er wird häufig zusammen mit Precision und Mean Average Precision (mAP) verwendet, um eine umfassende Bewertung der Erkennungsleistung zu erhalten, wie in den Anleitungen zu den YOLO beschrieben. Tools auf Plattformen wie Ultralytics HUB helfen den Nutzern, diese Metriken während der Modellschulung und -validierung zu verfolgen. Das Verständnis des Rückrufs hilft den Entwicklern, die Modelle auf bestimmte Anforderungen abzustimmen, z. B. um eine umfassende Erkennung in Sicherheitsalarmsystemen sicherzustellen. Die Bewertung der Leistung beinhaltet oft die Analyse von Metriken, die aus einer Konfusionsmatrix abgeleitet werden, und die Berücksichtigung des Kontexts von potenziell unausgewogenen Datensätzen.