Glossaire

Arbre de décision

Découvrez la puissance des arbres de décision dans l'apprentissage automatique pour la classification, la régression et les applications du monde réel comme la santé et la finance.

Un arbre de décision est un modèle d'apprentissage machine (ML) populaire et intuitif qui utilise une structure arborescente pour faire des prédictions. Il fonctionne en décomposant un ensemble de données en sous-ensembles de plus en plus petits tout en développant simultanément un arbre de décision associé. Le résultat final est un arbre avec des nœuds de décision et des nœuds de feuille. Un nœud de décision représente une caractéristique ou un attribut, une branche représente une règle de décision et chaque nœud de feuille représente un résultat ou une étiquette de classe. Comme sa structure ressemble à un organigramme, c'est l'un des modèles les plus simples à comprendre et à interpréter, ce qui en fait une pierre angulaire de la modélisation prédictive.

Fonctionnement des arbres de décision

Le processus de construction d'un arbre de décision consiste à diviser de manière récursive les données de formation en fonction des valeurs de différents attributs. L'algorithme choisit le meilleur attribut pour diviser les données à chaque étape, dans le but de rendre les sous-groupes résultants aussi "purs" que possible, c'est-à-dire que chaque groupe est principalement constitué de points de données ayant le même résultat. Ce processus de division est souvent guidé par des critères tels que l'impureté de Gini ou le gain d'information, qui mesurent le niveau de désordre ou d'aléatoire dans les nœuds.

L'arbre commence par un nœud racine unique contenant toutes les données. Il se divise ensuite en nœuds de décision, qui représentent des questions sur les données (par exemple, "L'âge du client est-il supérieur à 30 ans ?"). Ces divisions se poursuivent jusqu'à ce que les nœuds soient purs ou qu'une condition d'arrêt soit remplie, telle qu'une profondeur maximale de l'arbre. Les nœuds finaux, non divisés, sont appelés nœuds feuilles et fournissent la prédiction finale pour tout point de données qui les atteint. Par exemple, un nœud feuille peut classer une transaction comme "frauduleuse" ou "non frauduleuse". Cette interprétabilité est un avantage clé, souvent mis en avant dans les discussions autour de l'IA explicable (XAI).

Applications dans le monde réel

Les arbres de décision sont polyvalents et utilisés pour les tâches de classification et de régression dans divers secteurs.

L'IA dans les soins de santé pour le diagnostic: Un arbre de décision peut être utilisé pour créer un modèle de diagnostic préliminaire. Le modèle prend en compte les données du patient, telles que les symptômes (fièvre, toux), l'âge et les résultats de laboratoire, en tant qu'entrées (caractéristiques). L'arbre suit ensuite une série de règles de décision pour prédire la probabilité d'une maladie spécifique. Par exemple, une division peut être basée sur la fièvre du patient, suivie d'une autre division sur la gravité de la toux, pour finalement aboutir à un nœud feuille qui suggère un diagnostic probable. Les professionnels de la santé disposent ainsi d'un chemin clair, fondé sur des règles, qu'ils peuvent suivre. L'Institut national d'imagerie biomédicale et de bio-ingénierie (NIBIB) offre d'autres perspectives dans ce domaine.
Services financiers pour l'évaluation du risque de crédit : Les banques et les institutions financières utilisent des arbres de décision pour déterminer l'éligibilité d'un prêt. Le modèle analyse les données du demandeur telles que la cote de crédit, le revenu, le montant du prêt et l'historique de l'emploi. L'arbre peut d'abord être divisé en fonction de la cote de crédit. Si le score est élevé, il suit un chemin ; s'il est faible, il en suit un autre. Les divisions ultérieures sur les revenus et la durée du prêt permettent de classer le demandeur comme présentant un risque faible ou élevé, ce qui influe sur la décision d'approbation du prêt. Cette application est un élément essentiel de l'IA dans la finance.

Relations avec d'autres modèles

Les arbres de décision constituent la base de méthodes d'ensemble plus complexes qui offrent souvent une plus grande précision.

Forêts aléatoires: Ce modèle populaire construit plusieurs arbres de décision sur différents sous-ensembles aléatoires de données et de caractéristiques. Il regroupe ensuite leurs prédictions (en votant pour la classification ou en calculant la moyenne pour la régression), ce qui améliore les performances et rend le modèle plus robuste contre l'ajustement excessif.
Arbres à gradient boosté : Les modèles tels que XGBoost et LightGBM sont des techniques d'ensemble avancées qui construisent des arbres de décision de manière séquentielle, où chaque nouvel arbre corrige les erreurs de l'arbre précédent.
K-Means Clustering: Il est important de distinguer les arbres de décision des algorithmes de regroupement. K-Means est une méthode d'apprentissage non supervisée qui permet de regrouper des données non étiquetées, tandis que les arbres de décision sont utilisés pour l'apprentissage supervisé afin de faire des prédictions basées sur des données étiquetées.
Réseaux neuronaux convolutifs (CNN): Bien que puissants pour les problèmes liés aux données tabulaires, les arbres de décision sont moins efficaces pour les données à haute dimension telles que les images. Dans le domaine de la vision par ordinateur, des modèles tels que les CNN et les transformateurs de vision (ViT) sont utilisés à la place. Des architectures de pointe comme Ultralytics YOLO11 exploitent ces structures d'apprentissage profond pour des tâches complexes telles que la détection d'objets, la classification d'images et la segmentation d'instances.

La compréhension des modèles fondamentaux tels que les arbres de décision fournit un contexte précieux dans le paysage plus large de l'intelligence artificielle (IA). Des outils comme Scikit-learn fournissent des implémentations populaires pour les arbres de décision, tandis que des plateformes comme Ultralytics HUB rationalisent le développement et le déploiement de modèles de vision avancés pour des cas d'utilisation plus complexes.

Arbre de décision

Une solution flexible de licences d'entreprise pour stimuler votre innovation

Entraîner des modèles d'IA en quelques secondes avec Ultralytics YOLO

Former des modèles YOLO en toute simplicité avec Ultralytics HUB

Fonctionnement des arbres de décision

Applications dans le monde réel

Relations avec d'autres modèles

Plus d'informations dans cette catégorie

Guide ERP pour la fabrication

Système d'exécution de la fabrication (MES) : Production pilotée par l'IA

Comprendre la fabrication additive : Technologie et cas d'utilisation

Rejoindre la communauté Ultralytics