Optimise les modèles d'IA avec l'élagage : réduis la complexité, stimule l'efficacité et déploie plus rapidement sur les appareils périphériques sans sacrifier les performances.
L'élagage est une technique d'optimisation des modèles utilisée en intelligence artificielle (IA) et en apprentissage automatique (ML) pour réduire la taille et la complexité des modèles entraînés. Il consiste à supprimer de manière sélective les paramètres, tels que les poids ou les connexions au sein d'un réseau neuronal (NN), qui sont considérés comme moins importants ou redondants. L'objectif principal est de créer des modèles plus petits et plus rapides qui nécessitent moins de puissance de calcul et de mémoire, souvent sans baisse significative de la précision. Ce processus est crucial pour un déploiement efficace des modèles, en particulier sur les appareils aux ressources limitées.
À mesure que les modèles d'apprentissage profond (DL) deviennent plus volumineux pour s'attaquer à des tâches complexes, ils demandent des ressources informatiques importantes. L'élagage permet de relever ce défi en rendant les modèles plus légers. Cette optimisation réduit les besoins en stockage, diminue la consommation d'énergie et réduit la latence d'inférence, ce qui est vital pour les scénarios d'inférence en temps réel. L'élagage est particulièrement bénéfique pour le déploiement de modèles dans des environnements tels que les appareils mobiles, les systèmes embarqués et les applications Edge AI, où l'efficacité est primordiale.
Les techniques d'élagage sont largement appliquées dans divers domaines de l'intelligence artificielle. Voici deux exemples concrets :
Les méthodes d'élagage peuvent varier, mais elles entrent généralement dans ces catégories :
L'élagage peut être appliqué à différentes étapes : avant la formation (détermination de l'architecture), pendant la formation ou après la formation (affinage d'un modèle pré-entraîné). Des plateformes comme PyTorch fournissent des utilitaires pour faciliter les différentes techniques d'élagage.
L'élagage est l'une des nombreuses stratégies d'optimisation des modèles. Il est important de la distinguer des concepts apparentés :
Ces techniques ne s'excluent pas mutuellement et sont souvent combinées avec l'élagage pour atteindre une efficacité maximale. Pour une vue d'ensemble plus large, voir ce guide sur l'optimisation des modèles. Les modèles optimisés par l'élagage peuvent souvent être exportés dans des formats standard tels que ONNX pour une plus grande compatibilité de déploiement.
En résumé, l'élagage est une technique précieuse pour créer des modèles d'IA efficaces adaptés à divers besoins de déploiement, contribuant de manière significative à l'application pratique de la vision par ordinateur (VA) et d'autres tâches de ML. Les outils et les plateformes comme Ultralytics HUB intègrent ou facilitent souvent ces méthodes d'optimisation.