Découvre l'importance de la précision dans l'apprentissage automatique, son calcul, ses limites avec les ensembles de données déséquilibrés et les moyens d'améliorer les performances des modèles.
La précision est une mesure de performance fondamentale dans l'apprentissage automatique (ML), en particulier pour les tâches de classification. Elle mesure la proportion des prédictions totales qu'un modèle a correctement identifiées. En termes simples, elle répond à la question suivante : "Sur l'ensemble des prédictions effectuées, combien étaient réellement correctes ?". Il fournit un aperçu simple et de haut niveau des performances globales d'un modèle sur un ensemble de données donné.
La précision est calculée en divisant le nombre de prédictions correctes (à la fois les vrais positifs et les vrais négatifs) par le nombre total de prédictions effectuées. Bien qu'intuitive, la précision seule peut parfois être trompeuse, en particulier lorsqu'il s'agit d'ensembles de données déséquilibrés, c'est-à-dire de situations où une classe est nettement plus nombreuse que les autres. Par exemple, si un ensemble de données contient 95 % de courriels non spam et 5 % de courriels spam, un modèle qui prédit simplement "pas de spam" pour chaque courriel atteindra une précision de 95 %, bien qu'il soit inutile pour identifier le spam réel. Il est donc essentiel de prendre en compte la précision en même temps que d'autres mesures d'évaluation pour obtenir une image complète des performances du modèle. Tu peux obtenir plus d'informations sur l'évaluation des modèles et les stratégies d'ajustement.
Il est important de distinguer l'exactitude des mesures connexes :
Ces métriques sont souvent dérivées d'une matrice de confusion, qui fournit une répartition détaillée des classifications correctes et incorrectes pour chaque classe. Il est essentiel de comprendre ces mesures de performanceYOLO .
La précision sert de mesure de référence dans de nombreuses applications :
Au sein de l'écosystème Ultralytics , la précision est l'une des nombreuses mesures utilisées pour évaluer les performances des modèles, en particulier pour les tâches de classification d'images. Lorsque l'on compare des modèles, tels que YOLO11 par rapport à YOLOv8, les repères de précision sur des ensembles de données standard comme ImageNet fournissent des points de comparaison précieux, au même titre que la vitesse d'inférence et le coût de calcul. Cependant, pour les tâches de détection et de segmentation, les mesures telles que mAP sont prioritaires car elles reflètent mieux les défis spécifiques de ces tâches.