术语表

监督学习

了解监督学习如何利用标注数据为人工智能提供动力,从而实现准确预测以及物体检测和情感分析等应用。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

监督学习是机器学习(ML)的一个基本类别,算法从包含输入-输出对(称为标记数据)的数据集中学习。从本质上讲,该算法是 "有监督 "的,因为它是通过将其对输入数据的预测与训练数据中提供的已知正确输出(标签)进行比较来学习的。算法的目标是学习一个映射函数,该函数可以准确预测新的、未见过的输入的输出。这种方法是许多现代人工智能(AI)应用的核心,使系统能够根据历史实例做出预测或决策。

监督学习如何运作

这一过程始于一个数据集,其中每个数据点都由输入特征和相应的正确输出标签组成。例如,在图像分类任务中,输入是图像,标签是它们所属的类别(如 "猫"、"狗")。算法对训练数据进行迭代预测,并使用梯度下降优化算法调整其内部参数,以最小化预测结果与实际标签之间的差异(用损失函数衡量)。这种训练一直持续到模型在验证数据上达到令人满意的准确度为止。

相关性和应用

有监督学习的用途非常广泛,可为历史数据预测未来事件或对新信息进行分类的大量应用提供支持。它能够直接从标注的示例中学习,因此适用于要求高精度的任务。许多计算机视觉任务在很大程度上依赖于监督学习,包括由以下模型执行的任务 Ultralytics YOLO.

下面是两个具体的例子:

  1. 医学图像分析:监督学习模型可以在放射科医生标注的医学扫描(如 X 射线或核磁共振成像)数据集上进行训练。例如,通过对标注为 "肿瘤 "或 "无肿瘤 "的图像进行训练,模型可以学会检测医学成像中的肿瘤。这有助于医生进行诊断和制定治疗计划,从而为医疗保健领域的人工智能解决方案做出重大贡献。
  2. 情感分析:企业通常希望从评论或社交媒体帖子等文本数据中了解客户的意见。可以在标有情感("正面"、"负面"、"中性")的文本示例上训练监督模型。训练完成后,它可以自动对新文本进行分类,为市场研究和客户服务提供有价值的见解。了解有关情感分析的更多信息。

其他常见应用包括图像和视频中的物体检测(用于自动驾驶汽车和安全系统)、垃圾邮件过滤、预测房价(回归任务)以及面部识别

关键概念

有几个概念是理解监督学习的核心:

  • 标签数据:监督学习的基础,由与正确输出标签配对的输入数据组成。高质量的数据收集和标注至关重要。
  • 特征:模型用于预测的可测量输入变量或特征。特征工程可以极大地影响性能。
  • 标签(或目标):与训练数据中输入特征相关的正确输出值。
  • 分类:一种监督学习任务,目标是预测离散类别标签(例如,将电子邮件分为 "垃圾邮件 "或 "非垃圾邮件",或使用YOLO 等模型将图像分为不同类别)。
  • 回归:一种监督学习任务,目标是预测连续数值(例如,使用线性回归等算法预测温度、股票价格或房屋价值)。
  • 常用算法:包括逻辑回归支持向量机 (SVM)决策树随机森林等方法,以及各种类型的神经网络 (NN),尤其是用于图像相关任务的卷积神经网络 (CNN ),通常使用以下框架实现 PyTorch.

与其他学习范式的比较

监督学习有别于其他主要的机器学习范式:

  • 无监督学习算法在没有明确指导的情况下从无标签数据中学习模式。常见的任务包括聚类(将相似的数据点分组)和降维(简化数据)。当没有标记数据或目标是发现隐藏结构时,就会用到这种方法。
  • 强化学习算法通过与环境交互并接收以奖励或惩罚为形式的反馈来学习。其目标是学习一种策略(选择行动的策略),随着时间的推移使累积奖励最大化。它常用于机器人、游戏和导航系统。

总之,监督学习是一种强大的技术,它利用标记数据来训练预测任务的模型,是许多成功的人工智能应用的基础,包括Ultralytics 和Ultralytics HUB 等平台开发和支持的应用。

阅读全部