探索零点学习:一种尖端的人工智能方法,使模型能够对未见数据进行分类,彻底改变物体检测、NLP 等技术。
零点学习(Zero-Shot Learning,简称 ZSL)是机器学习(Machine Learning,简称 ML)中一个令人着迷的领域,在这个领域中,一个模型被训练成可以识别和分类它在训练阶段从未见过的数据类别。传统的监督学习方法需要为每一个可能的类别标注示例,与之不同的是,ZSL 的目的是利用共享的辅助信息将知识从见过的类别泛化到未见过的类别。在现实世界中,获取每个可能类别的标记数据是不现实或不可能的,而这种能力在这种情况下显得尤为重要。
ZSL 背后的核心理念是学习输入特征空间(如图像特征或文本特征)与语义嵌入空间之间的映射。这种语义空间通常会编码高级描述性属性或属性,这些属性或属性在可见和未知类别之间是共享的。例如,在计算机视觉中,这些可能是 "有条纹"、"有毛发"、"有翅膀 "等视觉属性,或者是基于文本的描述。在自然语言处理(NLP)中,词嵌入通常就是这种语义空间。
在训练过程中,模型学会将所见类别的特征与相应的语义表示(如属性或嵌入)联系起来。在推理时,当出现一个未见类别的实例时,模型会提取其特征并将其映射到所学的语义空间中。通过将该映射与未见类别的已知语义表征(单独提供)进行比较,即使没有先前的示例,模型也能预测类别标签。深度学习模型,尤其是使用对比学习(如CLIP)等技术的模型,由于能够学习丰富的特征表征,经常被用于 ZSL 任务。您可以探索适合此类任务的各种数据集,如Ultralytics Datasets 文档中所列的数据集。
Zero-Shot Learning 可在各个领域实现强大的应用:
重要的是要将 ZSL 与相关概念区分开来:
它们的主要区别在于,ZSL 在严格的条件下运行,即在训练或适应过程中,目标类的标注示例为零。有关比较概述,请参阅 "理解少点学习、零点学习和迁移学习"的讨论。
零点学习(Zero-Shot Learning)大大提高了人工智能系统的可扩展性和适应性。它减少了对详尽数据收集和注释的依赖,而这往往是开发大规模 ML 应用程序的瓶颈。通过使模型能够推理未见过的概念,ZSL 推动了人工智能(AI)的泛化,使系统更加强大,能够处理现实世界的开放性问题。Ultralytics HUB等平台为模型的训练和部署提供了便利,包括未来可能利用 ZSL 原理的模型。有关 ZSL 研究的更多详情,请查阅维基百科的 ZSL 页面等资源或arXiv 等平台上的学术调查。