Glossaire

Lissage des étiquettes

Améliore la précision et la robustesse des modèles d'IA grâce au lissage des étiquettes - une technique éprouvée pour améliorer la généralisation et réduire l'excès de confiance.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

Le lissage des étiquettes est une technique de régularisation utilisée dans l'apprentissage automatique, en particulier dans les tâches de classification, pour améliorer la généralisation et l'étalonnage des modèles. Il fonctionne en modifiant les étiquettes cibles utilisées pendant la formation, en adoucissant les étiquettes dures codées à un seul point pour réduire la confiance excessive dans les prédictions et encourager le modèle à être moins certain de ses classifications.

Qu'est-ce que le lissage des étiquettes ?

Dans les tâches de classification traditionnelles, les étiquettes cibles sont souvent représentées à l'aide d'un codage à un coup. Par exemple, si une image appartient à la classe "chat", l'étiquette est la suivante [0, 1, 0, 0] pour quatre classes (chien, chat, oiseau, poisson), indiquant une confiance totale (1,0) dans la classe "chat" et une confiance nulle (0,0) dans toutes les autres. Le lissage des étiquettes change cette situation en distribuant une petite quantité de masse de probabilité de la classe correcte vers les classes incorrectes. Au lieu d'une cible de [0, 1, 0, 0]Le lissage de l'étiquette peut le transformer en quelque chose comme [0.01, 0.9, 0.03, 0.06]. Cette cible ajustée indique que si l'image est bien un "chat", il y a une légère possibilité qu'il s'agisse d'autre chose.

Cet ajustement apparemment mineur a un impact significatif sur la façon dont les modèles apprennent. En empêchant le modèle de devenir trop confiant dans une seule classe pendant la formation, le lissage des étiquettes l'encourage à apprendre des caractéristiques plus robustes et généralisables. Il indique essentiellement au modèle que même les données d'apprentissage peuvent présenter une certaine incertitude ou du bruit, et qu'il ne doit pas s'adapter trop parfaitement aux données d'apprentissage, ce qui pourrait conduire à un surajustement.

Pourquoi le lissage des étiquettes est-il important ?

Le principal avantage du lissage des étiquettes est l'amélioration de la généralisation du modèle. Les modèles formés avec un codage standard à une touche peuvent devenir trop confiants dans leurs prédictions, en particulier sur les données d'apprentissage. Cet excès de confiance peut conduire à des performances médiocres sur des données non vues, car le modèle n'a pas appris à gérer l'incertitude ou les légères variations dans les données d'entrée.

Le lissage des étiquettes agit comme une forme de régularisation en pénalisant les prédictions trop confiantes. Il encourage le modèle à être moins discriminant et plus calibré, ce qui signifie que ses probabilités prédites reflètent davantage la probabilité réelle qu'une classe soit correcte. Cela se traduit souvent par une meilleure précision et une plus grande fiabilité, en particulier dans les applications réelles où les données sont souvent bruyantes et moins parfaites que les ensembles de données d'entraînement.

En outre, le lissage des étiquettes peut aider à empêcher les modèles de mémoriser les données de formation et d'apprendre à la place des représentations plus significatives. Il rend le processus de formation plus stable et moins sensible aux étiquettes bruyantes de l'ensemble de données.

Applications du lissage des étiquettes

Le lissage des étiquettes a été appliqué avec succès dans divers domaines de l'IA et de l'apprentissage automatique. Voici quelques exemples :

  1. Classification d'images : Dans la classification d'images avec les modèles Ultralytics YOLO , le lissage des étiquettes peut être utilisé pour améliorer la robustesse du classificateur. Par exemple, lors de l'entraînement d'un modèle sur ImageNet, l'application du lissage des étiquettes peut entraîner une augmentation faible mais significative de la précision de la validation. Ceci est particulièrement utile dans des scénarios tels que l'analyse d'images médicales où des estimations de probabilité précises et bien calibrées sont cruciales pour le diagnostic.

  2. Traitement du langage naturel (NLP) : Le lissage des étiquettes est également bénéfique pour les tâches de traitement du langage naturel, telles que la traduction automatique et la modélisation du langage. Par exemple, lors de la formation de grands modèles linguistiques tels que GPT-3 ou GPT-4, le lissage des étiquettes peut améliorer la capacité du modèle à s'adapter à de nouvelles phrases et à de nouveaux contextes. Il peut également améliorer la fluidité et la cohérence du texte généré en décourageant le modèle d'être trop déterministe dans ses prédictions de mots. Des techniques telles que l'ingénierie de l'invite peuvent tirer parti de l'amélioration de l'étalonnage grâce au lissage des étiquettes pour produire des textes plus fiables et mieux adaptés au contexte.

En incorporant le lissage des étiquettes dans le processus de formation, les développeurs peuvent construire des modèles d'IA plus fiables et plus robustes qui donnent de meilleurs résultats dans les scénarios du monde réel, en particulier lorsqu'ils utilisent des modèles puissants tels que. Ultralytics YOLOv8 pour les tâches de vision.

Tout lire