术语表

监督学习

了解监督学习如何利用标注数据为人工智能提供动力,从而实现准确预测以及物体检测和情感分析等应用。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

监督学习是机器学习的一种类型,算法通过标注数据集进行学习。把它想象成跟老师学习:老师会给你已经提供了 "正确答案 "的示例,而算法的工作就是找出这些示例与它们的标签之间的关系,从而预测新的、未见过的示例的标签。这种方法是人工智能在现实世界中许多应用的基础,它能让系统根据过去的数据做出预测或决策。

监督学习的相关性

监督学习是现代人工智能和机器学习的基石,为各行各业的大量应用提供了动力。监督学习能够从标注数据中学习,因此在我们希望预测结果或根据现有知识对新数据进行分类的任务中,监督学习的用途非常广泛。从实现复杂流程的自动化到提供具有洞察力的预测,监督学习对于创建能够理解周围世界并与之互动的智能系统至关重要。许多计算机视觉任务,包括由Ultralytics 模型支持的任务,都在很大程度上依赖于监督学习技术。

监督学习的应用

  • 物体检测:在计算机视觉领域,监督学习对于训练Ultralytics YOLOv8 等模型来检测图像或视频中的物体至关重要。通过在特定物体(如汽车、行人、交通标志)周围标有边框的图像数据集上进行训练,模型可以学会在新图像中识别和定位这些物体。这项技术对于自动驾驶汽车安全系统等应用至关重要。
  • 图像分类:监督学习也广泛应用于图像分类,即训练模型将图像归入预定义的类别。例如,可以训练一个模型来对不同类型的动物图像、用于疾病诊断的医学图像(医学图像分析)进行分类,甚至对不同类型的服装物品进行分类。这在从医疗零售的各个领域都至关重要。
  • 垃圾邮件检测:可在标记为 "垃圾邮件 "或 "非垃圾邮件 "的电子邮件数据集上训练监督学习算法。该算法能学会识别垃圾邮件的模式和特征,从而自动过滤收件箱中不需要的邮件。
  • 情感分析:在自然语言处理中,情感分析由监督学习提供支持。算法在标有情感(如正面、负面、中性)的文本数据(如客户评论或社交媒体帖子)上进行训练,以预测新文本输入的情感。这对企业了解客户意见和品牌认知非常有价值。

监督学习的关键概念

  • 标记数据: 标记数据是监督学习的基础。这意味着数据集中的每个数据点都有相应的标签,即 "正确答案 "或类别。例如,在图像分类中,每张图像都标有它所包含的对象。
  • 训练数据:标记数据用于训练监督学习模型。模型通过分析训练数据来学习输入特征和输出标签之间的基本模式和关系。
  • 算法:根据任务的不同,监督学习中使用了各种算法。常见的算法包括用于回归任务的线性回归,以及用于分类任务的逻辑回归支持向量机(SVM)和决策树。神经网络卷积神经网络(CNN)等更先进的算法用于图像识别和自然语言处理等复杂任务,通常使用以下框架实现 PyTorch.

从本质上讲,监督学习为构建人工智能系统提供了一个功能强大、适应性强的框架,使其能够学会进行准确的预测和分类,从而推动众多领域的创新。

阅读全部