术语表

监督学习

了解监督学习如何利用标注数据为人工智能提供动力,从而实现准确预测以及物体检测和情感分析等应用。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

监督学习是机器学习(ML)的一个基本类别,算法从包含输入-输出对(称为标记数据)的数据集中学习。从本质上讲,该算法是 "有监督 "的,因为它是通过将其对输入数据的预测与训练数据中提供的已知正确输出(标签)进行比较来学习的。算法的目标是学习一个映射函数,该函数可以准确预测新的、未见过的输入的输出。这种方法是许多现代人工智能(AI)应用的核心,使系统能够根据基准数据集或自定义数据集中的历史示例做出预测或决策。

监督学习如何运作

这一过程始于精心准备的数据集,其中每个数据点都包含输入特征和相应的正确输出标签。这通常需要在数据收集和标注方面投入大量精力。例如,在图像分类任务中,输入将是图像(可能使用OpenCV 等库中的技术进行了预处理),标签将是它们所属的类别(如 "猫"、"狗")。该算法对训练数据进行迭代预测,并使用随机梯度下降(SGD)亚当(Adam 优化算法调整其内部参数(或模型权重),以最小化预测结果与实际标签之间的差异。这种差异由损失函数来衡量。这种训练通常会持续多个历元,直到模型在单独的验证数据上达到令人满意的准确度或其他相关性能指标,确保模型能很好地泛化到新数据上,并避免过度拟合

相关性和应用

有监督学习的用途非常广泛,可为历史数据预测未来事件或对新信息进行分类的大量应用提供支持。它能够直接从标注的示例中学习,因此适用于要求高精度的任务。许多计算机视觉(CV)任务在很大程度上依赖于监督学习,包括那些由最先进的模型执行的任务,如 Ultralytics YOLO.

下面是两个具体的例子:

  • 医学图像分析:监督学习模型可以在放射科医生标注的医学扫描图像(如核磁共振成像或 CT 扫描图像)上进行训练,以检测医学影像中的肿瘤。这有助于医疗保健专业人员进行诊断,是许多医疗保健领域人工智能解决方案的核心部分。请参阅《放射学》等来源的相关研究:人工智能
  • 情感分析:算法从标有情感类别(如积极、消极、中性)的文本数据中学习,自动确定新文本(如客户评论或社交媒体帖子)中表达的情感。这对市场调研和品牌监测很有价值。了解有关情感分析的更多信息。

其他常见应用包括图像和视频中的物体检测(用于自动驾驶汽车安防系统)、垃圾邮件过滤、预测房价(回归任务)以及面部识别人工智能还可用于更智能的零售库存管理农业解决方案中的人工智能

关键概念

有几个概念对于理解和有效应用监督学习至关重要:

与其他学习范式的比较

监督学习有别于其他主要的机器学习范式:

  • 无监督学习这种方法使用未标记的数据,算法试图自己找到模式或结构,例如将相似的数据点分组(聚类)或降低数据维度。它不会从已知答案中直接学习输入到输出的映射。阅读 "无监督学习概述"。
  • 强化学习在这一范例中,代理通过与环境互动,并根据自己的行为接受奖励或惩罚,从而学会做出一系列决策。它通过试验和错误来学习最佳行为,而不是从标注的示例中学习。探索强化学习概述

总之,监督学习是一种强大而广泛使用的技术,它利用标记数据来训练预测任务的模型。它是许多成功的人工智能应用(包括Ultralytics 开发和支持的应用)的基础,也是数据科学或人工智能领域从业人员的一项重要技能。

阅读全部