术语表

决策树

了解决策树在机器学习分类、回归以及医疗保健和金融等实际应用中的强大功能。

决策树是一种流行而直观的机器学习(ML)模型,它使用树状结构进行预测。它将数据集分解成越来越小的子集,同时开发出相关的决策树。最终形成一棵具有决策节点和叶子节点的树。一个决策节点代表一个特征或属性,一个分支代表一条决策规则,而每个叶子节点则代表一个结果或一个类别标签。由于其结构类似于流程图,因此是最容易理解和解释的模型之一,也是预测建模的基石。

决策树的工作原理

建立决策树的过程包括根据不同属性的值递归地分割训练数据。该算法在每一步都会选择最佳属性来分割数据,目的是使得到的分组尽可能 "纯粹"--即每组主要由结果相同的数据点组成。拆分过程通常以吉尼不纯度或信息增益等标准为指导,这些标准衡量节点的无序或随机程度。

这棵树从包含所有数据的单一根节点开始。然后,它分裂成决策节点,这些节点代表有关数据的问题(例如,"客户的年龄是否超过 30 岁?)这些拆分一直持续到节点纯净或满足停止条件(如树的最大深度)为止。最后未拆分的节点称为叶节点,它们为到达它们的任何数据点提供最终预测。例如,叶节点可以将交易分为 "欺诈 "或 "非欺诈"。这种可解释性是一个关键优势,在围绕可解释人工智能(XAI)的讨论中经常得到强调。

实际应用

决策树用途广泛,可用于各行各业的分类和回归任务。

  1. 人工智能在医疗诊断中的应用决策树可用于创建初步诊断模型。该模型将病人的症状(发烧、咳嗽)、年龄和化验结果等数据作为输入(特征)。然后,决策树将遵循一系列决策规则来预测特定疾病的可能性。例如,可以根据病人是否发烧进行拆分,然后再根据咳嗽严重程度进行拆分,最终形成一个叶节点,提示可能的诊断结果。这就为医疗专业人员提供了一条清晰、基于规则的路径。美国国家生物医学成像和生物工程研究所(NIBIB)对这一领域有更深入的见解。
  2. 信用风险评估金融服务:银行和金融机构使用决策树来确定贷款资格。该模型分析申请人的数据,如信用评分、收入、贷款额度和工作经历。决策树可能首先根据信用评分进行分割。如果分数较高,则遵循一条路径;如果分数较低,则遵循另一条路径。随后对收入和贷款期限进行拆分,有助于将申请人划分为低风险或高风险,从而影响贷款审批决定。这一应用是人工智能在金融领域的核心部分。

与其他模型的关系

决策树是更复杂的集合方法的基础,通常能产生更高的准确性

人工智能(AI)的大背景下,了解决策树等基础模型非常有价值。Scikit-learn等工具为决策树提供了流行的实现方法,而Ultralytics HUB等平台则简化了高级视觉模型的开发和部署,适用于更复杂的用例。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板