术语表

逻辑回归

探索逻辑回归在二元分类中的强大功能。了解它在机器学习中的应用、关键概念和相关性。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

逻辑回归(LogisticRegression)是一种基本的统计和机器学习(ML)算法,主要用于二元分类问题,即预测两种可能结果中的一种。尽管其名称包含 "回归",但它是一种分类算法。它的工作原理是对给定输入属于特定类别的概率进行建模,通常输出一个介于 0 和 1 之间的值。

核心理念和功能

逻辑回归是根据一个或多个自变量(特征)来估计二元结果(如是/否、真/假或 0/1)的概率。它使用一种特定的数学函数(称为 sigmoid 或 logistic 函数),将输入特征的线性组合转换为概率分数。该分数代表实例属于正类(通常表示为 1)的可能性。然后将决策阈值(通常为 0.5)应用于该概率,将实例分配到特定类别。例如,如果预测概率大于 0.5,则该实例被归为 1 类;反之,则被归为 0 类。这属于监督学习的范畴。

与线性回归的比较

虽然逻辑回归和线性回归都是基础建模技术,但它们的用途不同。线性回归用于预测连续值(如预测房价),而逻辑回归用于预测分类结果,特别是用于分类任务的概率。Logistic 回归的输出通过 sigmoid 函数限制在 0 和 1 之间,因此适用于概率估计,而线性回归的输出范围可以无限大。

逻辑回归的类型

虽然最常见的形式是二元 Logistic 回归(两个结果类别),但也有一些扩展形式:

  • 多项式逻辑回归:当目标变量有三个或更多名义类别时使用(例如,对苹果、橙子、香蕉等水果类型进行分类)。
  • 序数逻辑回归:适用于目标变量有三个或更多有序类别的情况(例如,满意度评级为低、中、高)。

实际应用

逻辑回归因其在线性可分离数据上的简单性、可解释性和高效性而被广泛使用。

  1. 垃圾邮件检测:根据关键字、发件人信息和电子邮件结构等特征将电子邮件分类为 "垃圾邮件 "或 "非垃圾邮件"。这包括预测电子邮件成为垃圾邮件的概率。更复杂的技术可能涉及自然语言处理 (NLP)
  2. 医疗诊断:根据血压、体重指数和年龄等诊断测量结果,预测患者罹患特定疾病(如糖尿病)的可能性。这有助于早期检测和治疗规划,通常与医学图像分析相辅相成。了解更多有关人工智能在临床研究中的作用的信息。

相关性与评估

人工智能(AI)的大背景下,逻辑回归是分类任务的基准模型。通过解释其系数,可以了解每个特征对结果的影响,从而提高模型的可解释性。虽然神经网络 (NN)支持向量机 (SVM) 等更复杂的模型,甚至是用于物体检测的Ultralytics YOLO 等高级架构,往往能在复杂数据集上实现更高的性能,但对于更简单的问题或作为预测建模的第一步,逻辑回归仍然很有价值。

模型性能通常使用准确度精确度召回率F1 分数ROC 曲线下面积(AUC)等指标进行评估。Scikit-learn等库提供了强大的实现功能。了解这些YOLO 性能指标对更广泛的 ML 环境也有帮助。为了管理和部署各种 ML 模型,Ultralytics HUB等平台提供了全面的工具。

阅读全部