术语表

决策树

了解决策树在机器学习分类、回归以及医疗保健和金融等实际应用中的强大功能。

决策树是一种流行而直观的机器学习（ML）模型，它使用树状结构进行预测。它将数据集分解成越来越小的子集，同时开发出相关的决策树。最终形成一棵具有决策节点和叶子节点的树。一个决策节点代表一个特征或属性，一个分支代表一条决策规则，而每个叶子节点则代表一个结果或一个类别标签。由于其结构类似于流程图，因此是最容易理解和解释的模型之一，也是预测建模的基石。

决策树的工作原理

建立决策树的过程包括根据不同属性的值递归地分割训练数据。该算法在每一步都会选择最佳属性来分割数据，目的是使得到的分组尽可能 "纯粹"--即每组主要由结果相同的数据点组成。拆分过程通常以吉尼不纯度或信息增益等标准为指导，这些标准衡量节点的无序或随机程度。

这棵树从包含所有数据的单一根节点开始。然后，它分裂成决策节点，这些节点代表有关数据的问题（例如，"客户的年龄是否超过 30 岁？）这些拆分一直持续到节点纯净或满足停止条件（如树的最大深度）为止。最后未拆分的节点称为叶节点，它们为到达它们的任何数据点提供最终预测。例如，叶节点可以将交易分为 "欺诈 "或 "非欺诈"。这种可解释性是一个关键优势，在围绕可解释人工智能（XAI）的讨论中经常得到强调。

实际应用

决策树用途广泛，可用于各行各业的分类和回归任务。

人工智能在医疗诊断中的应用：决策树可用于创建初步诊断模型。该模型将病人的症状（发烧、咳嗽）、年龄和化验结果等数据作为输入（特征）。然后，决策树将遵循一系列决策规则来预测特定疾病的可能性。例如，可以根据病人是否发烧进行拆分，然后再根据咳嗽严重程度进行拆分，最终形成一个叶节点，提示可能的诊断结果。这就为医疗专业人员提供了一条清晰、基于规则的路径。美国国家生物医学成像和生物工程研究所（NIBIB）对这一领域有更深入的见解。
信用风险评估金融服务：银行和金融机构使用决策树来确定贷款资格。该模型分析申请人的数据，如信用评分、收入、贷款额度和工作经历。决策树可能首先根据信用评分进行分割。如果分数较高，则遵循一条路径；如果分数较低，则遵循另一条路径。随后对收入和贷款期限进行拆分，有助于将申请人划分为低风险或高风险，从而影响贷款审批决定。这一应用是人工智能在金融领域的核心部分。

与其他模型的关系

决策树是更复杂的集合方法的基础，通常能产生更高的准确性。

随机森林:这种流行的模型在数据和特征的不同随机子集上建立多个决策树。然后汇总它们的预测结果（分类时通过投票，回归时通过平均），从而提高性能，使模型更稳健，避免过度拟合。
梯度提升树 XGBoost和LightGBM等模型是先进的集合技术，它们按顺序构建决策树，每棵新树都会纠正前一棵树的错误。
K-Means 聚类:区分决策树和聚类算法很重要。K-Means 是一种无监督学习方法，用于对无标签数据进行分组，而决策树则用于监督学习，根据标签数据进行预测。
卷积神经网络 (CNN):虽然决策树在处理表格数据问题时非常强大，但在处理图像等高维数据时却不那么有效。在计算机视觉领域，CNN和视觉变换器（ViT）等模型被广泛使用。最先进的架构，如Ultralytics YOLO11，利用这些深度学习结构来完成物体检测、图像分类和实例分割等复杂任务。

在人工智能（AI）的大背景下，了解决策树等基础模型非常有价值。Scikit-learn等工具为决策树提供了流行的实现方法，而Ultralytics HUB等平台则简化了高级视觉模型的开发和部署，适用于更复杂的用例。

决策树

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

决策树的工作原理

实际应用

与其他模型的关系

在此类别中阅读更多内容

了解快速成型制造：技术和使用案例

使用 Ultralytics YOLO 监测机场地面运行11

机器人技术在制造业中的发展与未来

加入 Ultralytics 社区