了解监督学习如何利用标注数据为人工智能提供动力,从而实现准确预测以及物体检测和情感分析等应用。
监督学习是机器学习(ML)的一个基本类别,算法从包含输入-输出对(称为标记数据)的数据集中学习。从本质上讲,该算法是 "有监督 "的,因为它是通过将其对输入数据的预测与训练数据中提供的已知正确输出(标签)进行比较来学习的。算法的目标是学习一个映射函数,该函数可以准确预测新的、未见过的输入的输出。这种方法是许多现代人工智能(AI)应用的核心,使系统能够根据历史实例做出预测或决策。
这一过程始于一个数据集,其中每个数据点都由输入特征和相应的正确输出标签组成。例如,在图像分类任务中,输入是图像,标签是它们所属的类别(如 "猫"、"狗")。算法对训练数据进行迭代预测,并使用梯度下降等优化算法调整其内部参数,以最小化预测结果与实际标签之间的差异(用损失函数衡量)。这种训练一直持续到模型在验证数据上达到令人满意的准确度为止。
有监督学习的用途非常广泛,可为历史数据预测未来事件或对新信息进行分类的大量应用提供支持。它能够直接从标注的示例中学习,因此适用于要求高精度的任务。许多计算机视觉任务在很大程度上依赖于监督学习,包括由以下模型执行的任务 Ultralytics YOLO.
下面是两个具体的例子:
有几个概念是理解监督学习的核心:
监督学习有别于其他主要的机器学习范式:
总之,监督学习是一种强大的技术,它利用标记数据来训练预测任务的模型,是许多成功的人工智能应用的基础,包括Ultralytics 和Ultralytics HUB 等平台开发和支持的应用。