Glossaire

Rétropropagation

Apprends comment la rétropropagation entraîne les réseaux neuronaux, réduit les taux d'erreur et alimente efficacement les applications d'IA telles que la reconnaissance d'images et le NLP.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La rétropropagation est un algorithme fondamental dans le domaine de l'apprentissage profond (DL) utilisé pour l'entraînement des réseaux neuronaux (NN). Il s'agit de la méthode d'ajustement fin des poids d'un réseau neuronal en fonction du taux d'erreur obtenu à l'époque précédente (c'est-à-dire à l'itération). Un réglage correct des poids garantit des taux d'erreur plus faibles, ce qui rend le modèle fiable en augmentant sa généralisation. Il fonctionne en calculant le gradient de la fonction de perte par rapport aux poids du réseau. Essentiellement, après chaque passage avant dans un réseau, la rétropropagation effectue un passage arrière tout en ajustant les paramètres du modèle (weights and biases). Ce processus est crucial pour que le réseau apprenne et améliore ses performances au fil du temps.

Comment fonctionne la rétropropagation

L'algorithme de rétropropagation comporte deux phases principales : la passe avant et la passe arrière.

  1. Passage en avant: Au cours de la passe avant, les données d'entrée sont introduites dans le réseau, et le réseau produit une prédiction de sortie. La fonction de perte compare ensuite cette prédiction à la valeur cible réelle, en calculant l'erreur.
  2. Passage à rebours: Dans la passe arrière, l'algorithme calcule le gradient de la fonction de perte par rapport à chaque poids en appliquant la règle de chaîne du calcul. Les poids sont ensuite mis à jour dans la direction opposée du gradient, généralement à l'aide d'un algorithme d'optimisation comme la descente de gradient ou l'une de ses variantes. Cette étape est cruciale pour minimiser l'erreur dans les prédictions ultérieures.

Importance de la rétropropagation

La rétropropagation est essentielle pour la formation des modèles d'apprentissage profond, car elle fournit un moyen efficace sur le plan informatique de calculer les gradients nécessaires à la mise à jour des poids d'un réseau neuronal. Sans la rétropropagation, il serait impraticable de former des réseaux profonds avec plusieurs couches, car le coût de calcul des gradients serait prohibitif. Elle permet au réseau d'apprendre des modèles et des relations complexes dans les données en ajustant itérativement les poids pour minimiser l'erreur.

Applications réelles de la rétropropagation

La rétropropagation est utilisée dans un grand nombre d'applications dans divers domaines. En voici deux exemples :

  1. Reconnaissance d'images: Dans le domaine de la vision par ordinateur (VA), la rétropropagation est utilisée pour former des réseaux de neurones convolutifs (CNN) à des tâches telles que la classification d'images et la détection d'objets. Par exemple, dans les véhicules autonomes, les CNN sont entraînés à reconnaître des objets comme les piétons, les autres véhicules et les panneaux de signalisation, ce qui permet au véhicule de prendre des décisions de conduite éclairées. En savoir plus sur les véhicules autonomes.
  2. Traitement du langage naturel (NLP) : Dans le NLP, la rétropropagation entraîne des réseaux neuronaux récurrents (RNN) et des modèles de transformation pour des tâches telles que la traduction linguistique, l'analyse des sentiments et la génération de texte. Par exemple, la rétropropagation permet d'améliorer la précision des assistants virtuels comme Siri et Alexa en leur permettant de mieux comprendre les commandes des utilisateurs et d'y répondre. En savoir plus sur le traitement du langage naturel (NLP).

Termes connexes

  • Descente de gradient: Un algorithme d'optimisation utilisé pour minimiser la fonction de perte en ajustant itérativement les poids dans la direction de la descente la plus raide du gradient. En savoir plus sur la descente de gradient.
  • Fonction de perte: Une fonction qui mesure la différence entre la sortie prédite et la valeur cible réelle. L'objectif de la formation d'un réseau neuronal est de minimiser cette fonction. Découvre-en plus sur les fonctions de perte.
  • Réseau neuronal: Un réseau de nœuds interconnectés, ou "neurones", organisés en couches. Les réseaux neuronaux sont conçus pour reconnaître des modèles et constituent un élément fondamental de l'apprentissage profond. Plonge dans les réseaux neuronaux.
  • Fonction d'activation: Une fonction qui introduit la non-linéarité dans la sortie d'un neurone. Les fonctions d'activation les plus courantes sont ReLU, sigmoïde et tanh. Explore les fonctions d'activation.
  • Époque: Un passage complet sur l'ensemble des données de formation pendant le processus de formation. Plusieurs époques sont souvent nécessaires pour former efficacement un réseau neuronal. En savoir plus sur les époques.

Ces termes sont étroitement liés à la rétropropagation et sont essentiels pour comprendre comment les réseaux neuronaux sont formés. En comprenant la rétropropagation et ses concepts connexes, tu pourras mieux comprendre les mécanismes de l'apprentissage profond et la façon dont les modèles tels que Ultralytics YOLO sont formés à diverses tâches.

Tout lire