Glossaire

Descente stochastique de gradient (SGD)

Explore la descente stochastique de gradient, un algorithme rapide et efficace pour l'optimisation de l'apprentissage profond utilisé dans l'IA, comme Ultralytics YOLO modèles pour les tâches en temps réel.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La descente stochastique de gradient (SGD) est un algorithme d'optimisation populaire utilisé pour former des modèles d'apprentissage automatique, en particulier dans l'apprentissage profond. Il s'agit d'une méthode itérative permettant de minimiser une fonction objective, communément la fonction de perte, qui est cruciale dans l'apprentissage supervisé et non supervisé. Contrairement à la descente de gradient standard, qui utilise l'ensemble des données pour calculer le gradient de la fonction de perte, le SGD utilise un sous-ensemble aléatoire de données à chaque étape, ce qui le rend plus rapide et plus efficace, en particulier dans les grands ensembles de données.

Comment fonctionne le SGD

SGD met à jour les paramètres du modèle en les déplaçant dans la direction opposée au gradient de la fonction de perte. Il évalue le gradient en utilisant seulement un ou quelques exemples d'apprentissage, en fournissant des mises à jour fréquentes et en permettant une convergence plus rapide dans les scénarios de données à grande échelle. Cela rend SGD intéressant pour de nombreuses applications d'IA, y compris celles qui utilisent Ultralytics YOLO pour la détection et la segmentation d'objets en temps réel.

Caractéristiques principales

  • Efficacité: En ne prenant en compte qu'un sous-ensemble de données, SGD réduit les frais généraux par rapport aux méthodes à lot complet comme la descente de gradient.

  • Convergence: Bien que SGD puisse fluctuer davantage que Batch Gradient Descent en raison de sa nature stochastique, il trouve souvent de meilleures solutions en échappant aux minima locaux.

  • Flexibilité: SGD est compatible avec une variété de fonctions de perte et de modèles, ce qui renforce son utilité dans de nombreuses tâches d'apprentissage automatique.

Applications dans le monde réel

Voitures auto-conduites

Le SGD fait partie intégrante de la formation des modèles qui détectent et classent les objets dans l'environnement, tels que les piétons et les véhicules, garantissant ainsi une navigation sûre. Explore comment les applications de Vision AI maintiennent la sécurité routière dans les véhicules autonomes.

Diagnostic médical

Dans le domaine de l'imagerie médicale, SGD aide à développer des modèles capables de classer les images pour faciliter les diagnostics, comme l'identification des tumeurs dans les examens IRM. Découvre diverses applications de l'IA visionnaire dans le domaine de la santé.

Concepts apparentés

Descente en gradient

Bien que la descente de gradient soit l'approche traditionnelle, elle est moins efficace que le SGD dans les grands ensembles de données en raison du calcul du gradient sur l'ensemble de l'ensemble de données à chaque itération.

Adam Optimizer

L'Adam Optimizer s'appuie sur le SGD en utilisant des taux d'apprentissage adaptatifs, ce qui en fait un choix avancé et souvent préférable pour les modèles complexes.

Avantages et défis

SGD permet des itérations rapides et conduit souvent à une convergence initiale plus rapide, ce qui est avantageux pour les praticiens de l'apprentissage profond qui ont besoin d'un retour d'information en temps réel, comme dans la formation des modèles Ultralytics YOLO . Cependant, le caractère aléatoire peut conduire à des mises à jour bruyantes ; des techniques telles que les calendriers de taux d'apprentissage et l'élan peuvent atténuer ces problèmes.

Conclusion

La descente stochastique de gradient reste une pierre angulaire de la formation des modèles d'IA en raison de sa simplicité et de son efficacité. Son application s'étend à diverses industries et domaines de recherche, ce qui en fait un outil essentiel pour les praticiens qui visent à exploiter la puissance de l'apprentissage automatique et de la technologie de l'IA. Pour en savoir plus sur l'IA et ses impacts, visite le site suivant . Ultralytics pour avoir un aperçu de la façon dont ces technologies transforment les vies.

Tout lire