术语表

及时充实

通过及时强化掌握人工智能!使用上下文、清晰的说明和示例来增强大型语言模型的输出,从而获得精确的结果。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

提示丰富化是指在人工智能(AI)模型(尤其是大型语言模型(LLM))处理用户的初始输入提示之前,自动或半自动地对其进行增强的过程。其主要目的是通过添加相关的上下文信息、澄清潜在的歧义、设置限制或包含具体细节来提高人工智能输出的质量、相关性和具体性。这种技术完善了用户与人工智能系统之间的互动,使提示更加有效,而用户无需具备提示工程方面的深厚专业知识,从而改善了整体用户体验(UX)

即时充实如何运作

增强过程通常从分析原始用户提示开始。在分析的基础上,系统利用额外的信息源或预定义的规则来增强提示。这可能涉及访问用户交互历史记录、从知识库中检索相关文档、结合正在进行的对话的上下文或应用模型所需的特定格式化指令。例如,像 "总结Ultralytics 的最新发展 "这样的简单提示可以被丰富为 "总结Ultralytics YOLOv11YOLOv8相比的主要功能和性能改进"。 YOLOv8的主要特点和性能改进,重点是对象检测任务"。检索-增强生成(RAG)等技术是常用的技术,系统会获取相关数据片段(例如,从Ultralytics 文档中获取),并在将其发送给 LLM 之前将其纳入提示的上下文窗口中。这样可以确保模型具备必要的背景知识,从而生成全面准确的回复。

应用与实例

提示丰富功能在众多人工智能驱动的应用中都很有价值,可提高交互质量和任务性能:

  • 客户支持聊天机器人客户在询问 "我的订单状态如何?"时,可以通过API 集成客户关系管理 (CRM)系统中检索到的用户 ID 或最近的订单号来丰富提示内容。丰富后的提示可让聊天机器人立即提供具体的更新信息,而不是询问后续的澄清问题。
  • 个性化虚拟助手当用户要求Google 助手或 Alexa 等虚拟助手 "播放一些音乐 "时,可以根据用户的收听历史、偏好流派、时间,甚至通过联网设备检测到的当前活动来丰富提示内容,从而提供更加个性化的音乐选择。
  • 内容创建工具:使用文本生成功能 的创意写作助手可能会收到类似 "写一个故事 "的模糊提示。丰富提示内容可以根据之前的交互增加细节,比如 "写一个以反叛的主人公为主角、以乌托邦式的未来为背景的科幻短篇小说",从而使输出内容更符合用户的可能兴趣。
  • 语义搜索系统:在搜索公司内部文档时,"查找有关 Q4 业绩的报告 "这样的查询可以通过用户的部门、角色和访问权限进行丰富,从而从庞大的数据湖中检索出最相关、最有效的文档。

提示丰富与相关概念

了解迅速充实和类似术语之间的细微差别至关重要:

  • 提示工程这是一个典型的人工流程,人类要精心设计提示,以从人工智能中获得所需的反应。反之,提示丰富化则旨在将这一增强过程自动化或半自动化,通常是建立在最初的、不太完善的用户提示基础上。
  • 提示调整这种技术通过梯度下降来学习软提示嵌入,从而为特定任务调整冻结的预训练模型。它修改的是模型输入表示的一部分,而不是文本提示本身。这是一种参数高效微调(PEFT)技术。
  • 微调这包括在较小的特定任务数据集上更新预先训练好的模型权重。提示丰富化不会改变模型的参数;它只是修改了输入到现有模型的输入提示。
  • 检索增强生成(RAG)RAG 是提示强化系统经常使用的一种特定方法。它侧重于检索相关外部数据并将其添加到提示语境中,以改善事实基础并减少幻觉

计算机视觉的相关性

尽管提示丰富化最常见的是与 LLM 和自然语言理解(NLU)相关联,但其原理正逐渐与计算机视觉(CV)相关。传统的 CV 任务,如使用诸如 Ultralytics YOLO等模型进行的标准物体检测等传统 CV 任务通常依赖图像输入,而不是复杂的文本提示。然而,较新的多模态模型和可提示视觉系统(如CLIPYOLOYOLOE)接受文本或图像提示,以指导零点检测等任务。对于这些模型来说,用更多的上下文来丰富简单的文本提示(如 "检测车辆")(如 "在交通摄像头画面中只检测救护车和消防车等紧急车辆"),可以显著提高性能和特异性。Ultralytics HUB等平台有可能集成此类技术,以简化用户在定义复杂视觉任务或分析结果时的交互,这也是当前人工智能研发的一个领域,旨在提高人工智能在各个领域的安全性和可用性。

阅读全部