Glossaire

Élagage

Découvre comment l'élagage optimise les modèles d'IA en réduisant leur taille tout en conservant leur précision, ce qui permet d'obtenir des performances plus rapides et efficaces pour les applications du monde réel.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'élagage est une technique d'apprentissage automatique utilisée pour réduire la taille des réseaux neuronaux en supprimant les poids inutiles ou les neurones entiers qui contribuent de façon minimale aux performances du modèle. Ce processus permet de rationaliser le modèle, de le rendre plus efficace en termes de calcul, de mémoire et de consommation d'énergie, tout en conservant des niveaux de précision acceptables.

Pourquoi la taille est-elle importante ?

L'élagage est essentiel dans les scénarios où les ressources informatiques sont limitées, comme les appareils périphériques, les applications mobiles ou les systèmes embarqués. En se concentrant sur les composants les plus critiques d'un modèle, l'élagage permet une inférence plus rapide, réduit les besoins en stockage et minimise la consommation d'énergie. Ces avantages sont particulièrement précieux pour le déploiement de modèles dans des applications en temps réel, telles que celles alimentées par des systèmes de détection d'objets. Ultralytics YOLO pour la détection d'objets.

L'élagage joue également un rôle important dans l'optimisation des modèles, car il peut compléter des techniques telles que la quantification des modèles et l'ajustement des hyperparamètres pour améliorer les performances sans nécessiter de données supplémentaires ou de réentraînement à partir de zéro.

Comment fonctionne l'élagage

L'élagage consiste généralement à évaluer l'importance des poids, des neurones ou des couches d'un réseau neuronal. Des mesures telles que l'ampleur des poids, la contribution à la sortie ou la sensibilité à la perte sont utilisées pour identifier les composants qui peuvent être supprimés en toute sécurité. Une fois l'élagage terminé, le modèle peut être affiné pour récupérer toute perte mineure de précision causée par la suppression d'éléments.

Il existe trois approches courantes de la taille :

  • Élagage des poids: Supprime les poids individuels au sein des couches qui ont un impact minimal sur les prédictions du modèle. Cette méthode est très granulaire et peut être appliquée à l'ensemble du réseau.
  • Élagage des neurones: Élimine des neurones ou des canaux entiers en analysant leur contribution à la sortie du réseau. Cette approche est moins granulaire mais simplifie la structure du réseau.
  • Élagage structuré: Se concentre sur la suppression de composants plus importants, tels que des couches entières ou des cartes d'entités, afin d'obtenir des réductions plus significatives de la taille du modèle tout en maintenant l'interprétabilité.

Applications de la taille

L'élagage a trouvé des applications dans divers secteurs et cas d'utilisation, notamment :

  1. Voitures autonomes: Les modèles élagués sont utilisés dans les systèmes de détection et de suivi des objets en temps réel, ce qui garantit une prise de décision rapide et précise dans les véhicules autonomes. En savoir plus sur l'IA dans les voitures auto-conduites.

  2. Santé: Les modèles élagués sont mis en œuvre dans les outils d'imagerie médicale pour des tâches telles que la détection des tumeurs, où l'efficacité de calcul est essentielle pour fournir des diagnostics en temps voulu. Explore ceci dans AI in healthcare.

  3. Agriculture intelligente: L'élagage permet d'exécuter des modèles légers sur des drones ou des appareils IoT pour la surveillance des cultures et la détection des ravageurs. Vois comment cela fonctionne avec l'IA dans l'agriculture.

  4. Électronique grand public: Les appareils tels que les smartphones exploitent les modèles élagués pour des fonctions telles que la reconnaissance faciale ou les assistants vocaux, qui nécessitent un traitement rapide sur l'appareil.

L'élagage dans les applications IA/ML du monde réel

Exemple 1 : Améliorer les performances de l'intelligence artificielle

Dans les environnements de edge computing, tels que les drones ou les systèmes de surveillance, les modèles élagués sont d'une valeur inestimable. Par exemple, l'utilisation de techniques d'élagage sur les modèlesUltralytics YOLO peut réduire considérablement la taille du modèle tout en conservant sa précision, ce qui permet une détection plus rapide des objets directement sur les appareils sans dépendre des ressources du cloud.

Exemple 2 : Applications mobiles

Les modèles élagués sont largement déployés dans les applications mobiles où l'efficacité énergétique et les interactions rapides avec l'utilisateur sont des priorités. Par exemple, les applications mobiles employant l'IA pour la réalité augmentée ou la traduction en temps réel utilisent des versions élaguées des modèles d'apprentissage profond pour garantir des performances fluides.

Taille et techniques connexes

Alors que l'élagage se concentre sur la réduction de la taille d'un modèle formé, il diffère des techniques connexes telles que la quantification du modèle ou la distillation des connaissances. La quantification réduit la précision des poids du modèle (par exemple, en convertissant de 32 bits à 8 bits), tandis que la distillation des connaissances transfère les connaissances d'un grand modèle à un modèle plus petit. Ces techniques peuvent être combinées avec l'élagage pour maximiser l'efficacité.

Commencer à tailler

L'élagage peut être effectué manuellement ou à l'aide d'outils automatisés intégrés à des cadres d'apprentissage automatique tels que. PyTorch. Pour les utilisateurs qui cherchent à expérimenter l'élagage, des plateformes comme Ultralytics HUB fournissent des outils intuitifs pour former et optimiser les modèles, ce qui facilite la rationalisation des flux de travail.

En intégrant l'élagage dans ton pipeline d'apprentissage automatique, tu peux débloquer le potentiel de déploiement de modèles d'IA performants et économes en ressources dans diverses applications.

Tout lire