术语表

零距离学习

探索零点学习:一种尖端的人工智能方法,使模型能够对未见数据进行分类,彻底改变物体检测、NLP 等技术。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

零点学习(Zero-Shot Learning,简称 ZSL)是机器学习(Machine Learning,简称 ML)中一个令人着迷的领域,在这个领域中,一个模型被训练成可以识别和分类它在训练阶段从未见过的数据类别。传统的监督学习方法需要为每一个可能的类别标注示例,与之不同的是,ZSL 的目的是利用共享的辅助信息将知识从见过的类别泛化到未见过的类别。在现实世界中,获取每个可能类别的标记数据是不现实或不可能的,而这种能力在这种情况下显得尤为重要。

零距离学习如何运作

ZSL 背后的核心理念是学习输入特征空间(如图像特征或文本特征)与语义嵌入空间之间的映射。这种语义空间通常会编码高级描述性属性或属性,这些属性或属性在可见和未知类别之间是共享的。例如,在计算机视觉中,这些可能是 "有条纹"、"有毛发"、"有翅膀 "等视觉属性,或者是基于文本的描述。在自然语言处理(NLP)中,词嵌入通常就是这种语义空间。

在训练过程中,模型学会将所见类别的特征与相应的语义表示(如属性或嵌入)联系起来。在推理时,当出现一个未见类别的实例时,模型会提取其特征并将其映射到所学的语义空间中。通过将该映射与未见类别的已知语义表征(单独提供)进行比较,即使没有先前的示例,模型也能预测类别标签。深度学习模型,尤其是使用对比学习(如CLIP)等技术的模型,由于能够学习丰富的特征表征,经常被用于 ZSL 任务。您可以探索适合此类任务的各种数据集,如Ultralytics Datasets 文档中所列的数据集。

实际应用

Zero-Shot Learning 可在各个领域实现强大的应用:

  1. 新物体识别:图像分类物体检测中,ZSL 允许系统识别初始训练数据中不存在的物体。例如,根据专家提供的文字描述或语义属性集,经过普通动物训练的野生动物监测系统有可能识别出稀有或新发现的物种。Ultralytics YOLO等模型利用这种能力进行开放词汇检测。
  2. 动态内容分类:ZSL 可以将文档、新闻文章或用户生成的内容归类为新出现的主题,而这些主题之前并不存在标注数据。系统可以在现有类别的基础上进行训练,然后使用单词嵌入或主题描述对与意外事件或趋势相关的内容进行分类。

ZSL 与相关学习范式的比较

重要的是要将 ZSL 与相关概念区分开来:

  • 少量学习(Few-Shot Learning):旨在从极少量的标注示例(多于零)中学习新类别。
  • 单次学习少量学习的一种特殊情况,即每个新类别只有一个标注示例。
  • 迁移学习涉及利用从一项任务或领域中获得的知识来提高不同但相关的任务或领域的性能。通常涉及在目标数据(通常包括目标类别的示例)上对预训练模型进行微调

它们的主要区别在于,ZSL 在严格的条件下运行,即在训练或适应过程中,目标类的标注示例为。有关比较概述,请参阅 "理解少点学习、零点学习和迁移学习"的讨论。

人工智能的重要性

零点学习(Zero-Shot Learning)大大提高了人工智能系统的可扩展性和适应性。它减少了对详尽数据收集和注释的依赖,而这往往是开发大规模 ML 应用程序的瓶颈。通过使模型能够推理未见过的概念,ZSL 推动了人工智能(AI)的泛化,使系统更加强大,能够处理现实世界的开放性问题。Ultralytics HUB等平台为模型的训练和部署提供了便利,包括未来可能利用 ZSL 原理的模型。有关 ZSL 研究的更多详情,请查阅维基百科的 ZSL 页面等资源或arXiv 等平台上的学术调查。

阅读全部