Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Sous-apprentissage

Apprenez à identifier et à résoudre le sous-ajustement dans l'apprentissage automatique. Découvrez les causes, les indicateurs et comment optimiser les modèles Ultralytics pour une meilleure précision.

Le sous-ajustement se produit lorsqu'un modèle d'apprentissage automatique est trop simple ou n'a pas la capacité de saisir les tendances et les modèles sous-jacents dans les données d'entraînement. Conceptuellement, cela revient à essayer d'ajuster une ligne droite à des points de données qui forment une courbe distincte ; le modèle ne parvient pas à saisir la complexité de la relation entre les entrées et les sorties. Comme le modèle n'a pas appris les données de manière efficace, il affiche de de mauvaises performances non seulement sur l'ensemble d'apprentissage, mais aussi sur les données de validation non vues, ce qui conduit à une faible précision prédictive. Ce phénomène est souvent le résultat d'un biais élevé dans l'IA, où l'algorithme fait des hypothèses trop simplistes sur la fonction cible.

Causes et indicateurs

Plusieurs facteurs peuvent conduire à un modèle sous-ajusté. La cause la plus courante est l'utilisation d'une architecture de modèle qui n'est pas assez complexe pour la tâche à accomplir, comme l'application d'une régression linéaire à des données non linéaires. Une durée d'entraînement insuffisante, où le modèle ne dispose pas d'un nombre suffisant d' époches pour converger, empêche également un apprentissage adéquat. En outre, une régularisationexcessive, une technique généralement utilisée pour éviter le problème inverse, peut trop contraindre le modèle, l'empêchant ainsi de saisir des caractéristiques importantes .

Les ingénieurs peuvent identifier le sous-ajustement en surveillant les fonctions de perte pendant l'entraînement. Si l'erreur d'entraînement et l'erreur de validation restent élevées et ne diminuent pas de manière significative, le modèle est probablement sous-ajusté. Contrairement à une ingénierie des caractéristiques efficace, qui aide les modèles à comprendre les données, fournir trop peu de caractéristiques peut également priver le modèle des informations nécessaires.

Sous-appareillage et sur-appareillage

Il est essentiel de distinguer le sous-ajustement de son contraire, le surajustement. Ces deux concepts représentent les extrémités opposées du compromis biais-variance.

  • Sous-ajustement (biais élevé) : le modèle est trop rigide. Il fonctionne mal à la fois sur les données d'entraînement et les données de test, car il n'a pas appris le signal de base.
  • Surajustement (variance élevée) : le modèle est trop flexible. Il mémorise les données d'apprentissage, y compris le bruit, et fonctionne exceptionnellement bien pendant l'apprentissage, mais ne parvient pas à généraliser à de nouveaux exemples.

Trouver le « juste milieu » entre ces deux extrêmes est l'objectif principal de l' optimisation des modèles.

Applications concrètes

Il est essentiel de comprendre le sous-ajustement pour développer des systèmes d'IA fiables dans divers secteurs.

  • Conduite autonome : dans le contexte des véhicules autonomes, un modèle de détection d'objets sous-ajusté pourrait ne pas réussir à distinguer un piéton d'un lampadaire dans des environnements urbains complexes. Comme le modèle ne dispose pas des paramètres nécessaires pour apprendre les différences visuelles subtiles, il compromet la sécurité de l'IA.
  • Diagnostic médical : lors de l'application de l' analyse d'images médicales pour detect telles que des tumeurs, un modèle trop simple peut passer à côté de petites excroissances ou d'excroissances irrégulières. Si le réseau neuronal est trop superficiel, il ne peut pas apprendre les textures complexes nécessaires pour une sensibilité et une spécificité élevées, ce qui conduit à des erreurs de diagnostic.

Résoudre le sous-ajustement avec du code

Dans vision par ordinateur, le sous-ajustement se produit souvent lorsqu'on utilise une variante de modèle trop petite pour la difficulté de la tâche (par exemple, la détection de petits objets dans des images de drones à haute résolution). Les éléments suivants Python Cet exemple montre comment passer d'un modèle plus petit à un modèle plus grand et plus performant à l'aide du ultralytics bibliothèque pour résoudre un éventuel sous-ajustement.

from ultralytics import YOLO

# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")

# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

En passant à un modèle Ultralytics plus grand et en garantissant une durée de formation adéquate, le système acquiert les paramètres nécessaires pour apprendre des modèles complexes, ce qui permet de réduire efficacement le sous-ajustement. Pour vérifier que votre modèle n'est plus sous-ajusté, évaluez-le toujours par rapport à un ensemble de données de test robuste . Pour gérer les ensembles de données et suivre les expériences afin de détecter rapidement le sous-ajustement, la Ultralytics offre des outils complets de visualisation et d'analyse.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant