通过及时强化掌握人工智能!使用上下文、清晰的说明和示例来增强大型语言模型的输出,从而获得精确的结果。
提示丰富化是指在人工智能(AI)模型(尤其是大型语言模型(LLM))处理用户的初始输入提示之前,自动或半自动地对其进行增强的过程。其主要目的是通过添加相关的上下文信息、澄清潜在的歧义、设置限制或包含具体细节来提高人工智能输出的质量、相关性和具体性。这种技术完善了用户与人工智能系统之间的互动,使提示更加有效,而用户无需具备提示工程方面的深厚专业知识,从而改善了整体用户体验(UX)。
增强过程通常从分析原始用户提示开始。在分析的基础上,系统利用额外的信息源或预定义的规则来增强提示。这可能涉及访问用户交互历史记录、从知识库中检索相关文档、结合正在进行的对话的上下文或应用模型所需的特定格式化指令。例如,像 "总结Ultralytics 的最新发展 "这样的简单提示可以被丰富为 "总结Ultralytics YOLOv11与YOLOv8相比的主要功能和性能改进"。 YOLOv8的主要特点和性能改进,重点是对象检测任务"。检索-增强生成(RAG)等技术是常用的技术,系统会获取相关数据片段(例如,从Ultralytics 文档中获取),并在将其发送给 LLM 之前将其纳入提示的上下文窗口中。这样可以确保模型具备必要的背景知识,从而生成全面准确的回复。
提示丰富功能在众多人工智能驱动的应用中都很有价值,可提高交互质量和任务性能:
了解迅速充实和类似术语之间的细微差别至关重要:
尽管提示丰富化最常见的是与 LLM 和自然语言理解(NLU)相关联,但其原理正逐渐与计算机视觉(CV)相关。传统的 CV 任务,如使用诸如 Ultralytics YOLO等模型进行的标准物体检测等传统 CV 任务通常依赖图像输入,而不是复杂的文本提示。然而,较新的多模态模型和可提示视觉系统(如CLIP、YOLO 和YOLOE)接受文本或图像提示,以指导零点检测等任务。对于这些模型来说,用更多的上下文来丰富简单的文本提示(如 "检测车辆")(如 "在交通摄像头画面中只检测救护车和消防车等紧急车辆"),可以显著提高性能和特异性。Ultralytics HUB等平台有可能集成此类技术,以简化用户在定义复杂视觉任务或分析结果时的交互,这也是当前人工智能研发的一个领域,旨在提高人工智能在各个领域的安全性和可用性。