Glossaire

Taille des modèles

Optimise les modèles d'apprentissage automatique grâce à l'élagage des modèles. Obtiens une inférence plus rapide, une utilisation réduite de la mémoire et une efficacité énergétique pour les déploiements à ressources limitées.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'élagage des modèles est une technique cruciale de l'apprentissage automatique axée sur l'optimisation des modèles formés. Elle rationalise les modèles en réduisant leur complexité et leur taille, ce qui est réalisé en supprimant les paramètres les moins critiques, tels que les poids et les connexions, d'un réseau neuronal. Ce processus rend les modèles plus efficaces sans sacrifier de manière significative les performances, ce qui se traduit par des avantages tels qu'un traitement plus rapide, une utilisation moindre de la mémoire et une réduction de la consommation d'énergie, ce qui est particulièrement bénéfique pour le déploiement dans des environnements où les ressources sont limitées.

Pourquoi utiliser l'élagage par modélisation ?

Il existe plusieurs raisons impérieuses d'employer l'élagage des modèles. Tout d'abord, il réduit considérablement la taille des modèles d'apprentissage automatique, ce qui les rend plus faciles à déployer sur des appareils dont le stockage est limité, comme les téléphones portables ou les systèmes périphériques. Des modèles plus petits conduisent également à des vitesses d'inférence plus rapides, car il y a moins de calculs nécessaires pour générer des prédictions. Cette amélioration de la vitesse est vitale pour les applications en temps réel telles que la détection d'objets dans les véhicules autonomes ou pour l'analyse de vidéos en direct. De plus, les modèles élagués consomment moins d'énergie, un avantage crucial pour les appareils fonctionnant sur batterie et les centres de données à grande échelle visant des pratiques d'IA durables.

Types d'élagage des modèles

La taille des modèles peut être classée en deux grandes catégories :

  • Élagage des poids: Cette technique se concentre sur la suppression de poids individuels au sein du réseau neuronal. Elle peut être divisée en deux catégories : l'élagage structuré et l'élagage non structuré. L'élagage non structuré supprime les poids individuels indépendamment de leur position, ce qui entraîne une faible densité mais des schémas d'accès à la mémoire potentiellement irréguliers. L'élagage structuré, quant à lui, supprime des structures entières telles que les filtres ou les canaux, ce qui permet d'obtenir des modèles plus compacts et plus faciles à utiliser.
  • Élagage des neurones: L'élagage des neurones, également connu sous le nom d'élagage des nœuds ou des unités, consiste à supprimer des neurones ou des nœuds entiers d'un réseau neuronal. Cette méthode simplifie l'architecture du réseau de manière plus agressive que l'élagage des poids et peut parfois conduire à des accélérations plus significatives et à une réduction de la taille du modèle.

L'élagage des modèles par rapport à d'autres techniques d'optimisation

Alors que l'élagage du modèle réduit la taille du modèle en supprimant des paramètres, d'autres techniques comme la quantification du modèle et la distillation des connaissances offrent d'autres stratégies d'optimisation. La quantification réduit la précision des poids (par exemple, de 32 bits en virgule flottante à 8 bits en nombres entiers), ce qui diminue également la taille du modèle et accélère le calcul sans modifier la structure du modèle. La distillation des connaissances entraîne un modèle "étudiant" plus petit à imiter le comportement d'un modèle "enseignant" plus grand et plus complexe. Ces techniques sont souvent utilisées en combinaison avec l'élagage pour obtenir des gains d'efficacité encore plus importants. Par exemple, un modèle peut d'abord être élagué pour réduire sa taille, puis quantifié pour optimiser davantage ses performances en vue de son déploiement.

Applications concrètes de l'élagage des modèles

L'élagage des modèles est largement appliqué dans divers domaines, en particulier lorsque les ressources informatiques sont limitées ou que l'efficacité est primordiale. Voici quelques applications clés :

  • Appareils mobiles et périphériques: Le déploiement des modèlesUltralytics YOLO sur les appareils mobiles pour la détection d'objets et le traitement d'images en temps réel exige des modèles efficaces. L'élagage permet de réduire la taille du modèle et la latence, ce qui rend possible l'exécution de tâches d'IA complexes sur les smartphones et les appareils IoT.
  • Véhicules autonomes: Les voitures autonomes nécessitent une prise de décision rapide basée sur les données des capteurs. Les modèles élagués garantissent une inférence rapide pour les tâches critiques telles que la détection des piétons et le maintien de la voie, où une faible latence est cruciale pour la sécurité.

Conclusion

L'élagage des modèles est une technique d'optimisation essentielle pour déployer des modèles d'apprentissage automatique efficaces. En réduisant la taille et la complexité des modèles, elle permet d'accélérer l'inférence, de diminuer l'utilisation de la mémoire et de réduire la consommation d'énergie. Ultralytics fournit une série d'outils et de ressources pour aider les utilisateurs à optimiser leurs modèles, y compris des techniques comme l'élagage, afin d'améliorer l'aspect pratique et l'efficacité de leurs applications de vision par ordinateur dans divers scénarios de déploiement.

Tout lire