绿色检查
链接复制到剪贴板

深度研究模型在人工智能进步中的作用

探索新的深度研究模型如何实现复杂研究的自动化。我们还将比较 OpenAI、Google和 Perplexity 发布的模型。

科研工作总是在与时间赛跑。现在,有了人工智能(AI),这场竞赛变得比以往任何时候都要快。人工智能不再仅仅是将任务自动化。它正在改变我们收集、分析和解读信息的方式。从对海量数据集进行排序到在几秒钟内发现见解,人工智能研究工具正在重新定义信息发现的速度和深度。

这种转变的一个关键部分是深度研究模型的兴起,它已迅速成为一种主要趋势。整个人工智能行业的公司都在推出自己的版本,这标志着人工智能处理和提供信息的方式发生了根本性的变化。 

与提供表面回应的传统人工智能工具不同,这些先进的模型深入研究,试图提供高度关联化和准确的见解。OpenAI、Google和 Perplexity 等领先科技公司正在推动这一运动,不断提高人工智能的研究能力。

这种进步在 "人类最后的考试 "等基准测试中表现得非常明显,该测试对人工智能模型的复杂推理和解决问题能力进行评估。与之前的版本相比,OpenAI 的深度研究模型取得了令人瞩目的进步。这种性能上的飞跃意味着该模型可以准确无误地解决具有挑战性的研究问题。

在本文中,我们将探讨 OpenAI、Google和 Perplexity 的深度研究模型的独特功能。我们将探讨这些模型如何增强研究方法、提高工作效率以及塑造人工智能助手的未来。

深度研究模型概述

让我们先来看看不同的深度研究模式是如何通过先进的洞察力推动研究创新的。

OpenAI 的深度研究模式

2025 年 2 月 2 日,OpenAI 推出了深度研究(Deep Research),这是一种类似于人工智能代理的高级模型,专为深度、多步骤研究而设计。通过即将推出的 OpenAI o3 模型的一个变体,它可以扫描数百个来源,包括文本、图像和 PDF。然后,它利用这些数据在 5 至 30 分钟内生成详细的引用报告,这比人工研究快得多。

与基本的人工智能聊天机器人不同,"深度研究 "是为金融、科学和工程等领域的专业人士打造的,他们需要的是准确、有深度的工具,而不仅仅是快速的答案。深度研究甚至会在过程中要求用户说明,以完善其结果。 

OpenAI 正在不断改进它,最近还增加了带引文的嵌入式图片和更好的文件处理。总之,无论是分析市场还是细分技术研究,Deep Research 的目标都是提供结构化的可靠见解。

图 1.OpenAI 深度研究模型一览。

Google双子座深度研究模型

Google的 "双子座深度研究"(Gemini Deep Research)于2024年12月11日推出,是一款人工智能助手,旨在简化与深度研究相关的复杂任务。它通过进行网络搜索、分析数据和生成结构化报告来实现整个过程的自动化。它还能提供直接的源链接,所有这一切只需五分钟左右。

Gemini 的独特之处在于其动态的迭代方法。它不只是获取静态结果,而是在发现新的见解时改进查询。开始时,它搜索一般信息,但随着收集到更多细节,它就会改变搜索重点。这个过程会不断重复,直到生成一份清晰、结构合理的摘要,并导出为格式整齐的文档。

双子座还能帮助用户发现有价值但往往被忽视的资源,否则标准搜索可能会错过这些资源。如果您需要某个主题的更多详细信息,只需提出一个后续问题,Gemini 就能实时完善报告。 

图 2. Google的双子座深度研究模型。

Perplexity 的深度研究模式

Perplexity的深度研究模式于2025年2月14日推出,它将问题解答提升到了一个新的水平。它可以进行多次搜索,分析数百个信息来源,并应用高级推理来提供专家级的见解,所有这一切只需几分钟时间。

该工具可以处理复杂的主题,从而节省时间,否则需要数小时的人工研究。它的方法既智能又自适应:它可以搜索网络、阅读文档,并在收集到更多信息后改进策略。结果可以是一份清晰、详细的报告,您可以将其导出为 PDF 或文档,或作为 Perplexity Page 共享。

图 3.Perplexity 的深度研究聊天界面。

Deep Research 的人工智能模型有何与众不同之处?

真正使这些模型与众不同的是它们的智能研究方法。每个模型都采用先进的技术,高效地提供高质量的答案。 

下面我们就来看看它们是如何工作的:

  • OpenAI 的深度研究模型:该模型在具有挑战性的浏览和推理任务中通过强化学习 进行端到端训练,使其能够规划多步搜索轨迹来定位和验证数据。它可以根据新发现的信息,通过回溯和调整策略来实时调整。
  • Google的双子座深度研究模式:它制定多步骤研究计划,反复浏览和改进网络搜索,以收集、验证和综合相关数据。它会根据新信息不断调整方法。
  • Perplexity 的深度研究模式:它通过搜索、阅读和推理数以百计的资料来源,反复生成和完善研究计划,从而深入理解某个主题。 

尽管在这些模型的引擎盖下运行着不同的程序,但它们具有许多共同的功能。它们都能分析数据、识别关键模式并生成结构化报告,以清晰易读的格式呈现见解。同样,它们还可以使用图表等可视化辅助工具,使信息更易于解读。此外,它们还支持确保透明度的内置引用管理。 

图 4.深度研究模型的核心功能。图片由作者提供。

深度研究模式的影响 

深度研究模型可以快速、准确地处理复杂的研究任务,从而重新定义我们的工作方式。它们可以在几分钟内分析海量信息,提供结构化的见解,为各行各业节省时间。 

通过识别隐藏的模式并生成精确的观察结果,这些模型可以帮助企业优化运营、预测趋势并做出更明智的决策。除大型企业外,这些模型还能让学生、小公司和个人获得专家级的研究成果,从而在没有专业知识的情况下做出明智的选择。 

跨行业的实际应用

以下是深度研究模型在现实世界中的一些应用:

  • 投资和财务分析: 它们可用于对市场数据、财务报告和新闻趋势进行深入审查,帮助投资者和分析师识别有利可图的机会和风险。
  • 加速科学研究:医学等领域的研究人员可以利用这些模型研究数据,探索新的突破。例如,他们可以扫描成千上万的研究论文,找出潜在的治疗方法。
  • 产品开发洞察力:这些模型有助于审查客户反馈、市场趋势和竞争数据,为产品创新和战略规划提供信息。
  • 支持政策决策:政府和研究机构可以利用这些模型分析全球问题,协助制定更有影响力的政策和法规。 
  • 自动法律研究: 这些模型可以快速分析庞大的判例法、法规和法律意见数据库,找出相关先例和见解。 

比较深度研究模型

每个深度研究模型都有自己的优势和局限性。例如,OpenAI 的深度研究模型在 "人类最后的考试 "基准测试中达到了 26.6% 的准确率,不过它仅限于专业版用户使用。

与此同时,Perplexity 的深度研究 模型提供了友好的用户界面,每日查询免费,准确率达到 21.1%。同时,Gemini 的深度研究模型是一款速度更快的人工智能助手,但准确率较低,仅为 6.2%,而且需要付费订阅 Gemini Advanced。

图 5.深度研究模型比较。图片由作者提供。

利用深度研究模型的利弊

既然我们已经了解了这些模型如何推动各行各业的洞察力,下面就让我们快速了解一下它们的优势:

  • 可扩展性:这些模型可适应从快速信息检索到深入分析的各种研究需求。它们既能处理小规模查询,也能处理跨行业的大规模项目。 
  • 节约成本:复杂研究流程的自动化减少了对手工操作的需求,从而大大降低了劳动力成本。企业可以将节省下来的成本用于创新,从而提高整体生产率。
  • 趋势预测: 这些模型可以分析海量数据,在新趋势成为主流之前将其识别出来。通过及早发现模式和变化,它们可以帮助用户做出明智的决策。

虽然这些模式有很多优点,但也有一些需要注意的挑战:

  • 语境超载:这些模型有时会过度分析,专注于细枝末节,产生冗长的报告。用户可能需要完善输出,以提取最相关的见解。
  • 道德困境:深度研究人工智能模型可能会从受版权保护的内容中获取信息。这可能会导致潜在的法律问题。企业可以仔细审查输出结果,以确保合规。
  • 技能依赖性:获得最佳结果需要人工智能知识。不明确的提示会导致模糊的答案。没有精确查询经验的用户可能难以最大限度地发挥模型的潜力。

主要收获

深度研究模型仍处于早期阶段。虽然它们可以快速获得经过深入研究的答案,但这些答案并不总是可靠的。这些模型有时会曲解数据,将可信来源与谣言混为一谈,或未能突出不确定性。不过,随着不断进步,它们有可能成为可靠的研究工具。

对于快速解答,GPT-4o 等更简单的模型效果很好,而且可能更具成本效益。不过,随着人工智能的不断进步,我们可以期待这些深度研究模型不断发展,并提供更准确的日常见解。 

加入我们的社区,探索我们的GitHub 存储库,了解有关人工智能的更多信息。在我们的解决方案页面上探索人工智能在医疗保健 自动驾驶汽车中的应用。查看我们的许可选项,立即开始您的视觉人工智能项目。

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅