术语表

半监督学习

了解半监督学习如何结合已标记和未标记数据来增强人工智能模型、降低标记成本并提高准确性。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

半监督学习(Semi-Supervised Learning)是机器学习的一个分支,它在监督学习和非监督学习之间架起了一座桥梁。它同时利用有标签和无标签数据来训练模型。在现实世界的许多场景中,获取标记数据既昂贵又耗时,需要专家手动标注。而另一方面,非标记数据往往可以大量获得。半监督学习技术可以利用大量未标注数据来提高模型的性能,尤其是在标注数据稀缺的情况下。

半监督学习的工作原理

有监督学习完全依赖标记数据,而无监督学习只使用无标记数据,与之不同的是,半监督学习将两者结合起来。其核心理念是,未标记数据包含有关数据分布底层结构的宝贵信息。通过结合这些信息,半监督学习模型通常能比仅使用有限标签数据训练的模型获得更好的准确性和泛化效果。

有几种技术属于半监督学习的范畴,其中包括

  • 伪标记:这种方法是在有标签的数据上训练一个模型,然后用它来预测无标签数据的标签。然后将这些预测标签(或称 "伪标签")当作真实标签处理,并用于重新训练模型,通常是反复训练。
  • 一致性正则化:这种方法鼓励模型对未标注的数据点做出相似的预测,即使这些数据点受到轻微扰动或增强。数据增强等技术通常用于产生这些扰动。
  • 基于图形的方法:这些方法将数据点表示为图中的节点,图中的边将相似的点连接起来。然后根据图结构将标签从有标签的节点传播到无标签的节点。
  • 自我训练:与伪标注类似,自我训练通过在未标注数据上添加高置信度预测,迭代扩展标注数据集。

半监督学习的应用

半监督学习在各个领域都很有价值,尤其是在标记数据有限的情况下:

  • 医学图像分析:医学图像分析中,为完成肿瘤检测或疾病分类等任务而获取有标记的医学图像通常需要放射科专家,因此成本高昂且耗时较长。半监督学习有助于使用较小的标注图像集和较大的未标注扫描图像库来训练精确的模型。例如,在使用Ultralytics YOLO 进行对象检测的脑肿瘤检测中,半监督技术可以在有限的标记 MRI 数据中提高模型性能。
  • 自然语言处理(NLP): 情感分析命名实体识别(NER)等任务通常得益于半监督学习。大量的文本数据唾手可得,但为特定的 NLP 任务标记文本却非常费力。半监督方法可以利用未标注文本来提高模型对语言细微差别和上下文的理解。
  • 语音识别:与 NLP 类似,语音识别系统也能从大量未标记的音频数据中获益。半监督学习有助于建立稳健的模型,即使标注的语音数据有限,也能很好地泛化。
  • 图像分类和物体检测图像分类物体检测计算机视觉任务中,半监督学习可用于提高模型的性能,例如 Ultralytics YOLOv8等模型的性能。Ultralytics HUB可用于管理数据集和训练模型,并可集成半监督学习,以优化有限标签数据的训练。

半监督学习的优势

  • 提高准确性:通过利用无标记数据,半监督学习通常能产生比使用有限标记数据的监督学习更高精度的模型。
  • 降低贴标成本:它大大减少了对大量人工数据标签的需求,节省了时间和资源。
  • 更好的泛化:同时使用标注数据和未标注数据进行训练,有助于模型学习更稳健、可泛化的表征,从而在未见数据上取得更好的性能。

半监督学习(Semi-Supervised Learning)为机器学习提供了一种强大的方法,尤其是在标记数据成为瓶颈的情况下。通过有效利用大量可用的非标记数据,半监督学习可以在广泛的应用中开发出更准确、更高效的人工智能系统。

阅读全部