admin管理员组

文章数量:1437305

Deep Research轻量版到底有多强?股市分析、找冷门片、旅游规划全搞定!

OpenAI最近在周四宣布,想免费用户也开始推送轻量版的Deep Research。这个功能由o4-mini 模型版本提供支持。虽然其能力不及“完整版”深度研究工具,但 OpenAI 称其运行成本更低,因此可以提高用户的使用上限。

这次的Deep Research功能有如下几个优点:

  • 模型架构:​采用 o4-mini 模型,具备多模态推理能力。
  • 成本效率:​单次查询成本仅为标准版的五分之一,支持实时动态资源调度,有效缓解服务器负载压力。
  • 响应速度:​通过混合精度计算与缓存机制,处理复杂任务时响应时间缩短约 40%。
  • 功能兼容性:​保留标准版 90% 的核心能力,针对免费用户需求简化了部分高级功能。 ​

免费用户现在打开网页就可以看到这个功能了:

超越文本的性能表现

Deep Research到底有多牛?看看这俩测试就明白了:在Humanity’s Last Exam和GAIA这两个权威大考里,它的成绩直接碾压了其他竞品和老一代AI模型。

不过要强调的是,Deep Research虽然很厉害,但它离真正的通用人工智能(AGI)还差得远呢。它只是一个辅助工具,不能代替人类研究员。 这也说明,AI还有很长的路要走。

Deep Research功能实测

1.股价分析

分析一下最近特斯拉的股价情况

首先它会需要你回到要查询“特斯拉”哪些方面的情况。比如想了解最近一个月特斯拉的股价情况等等。

可以从右边栏看到chatgpt的活动,它在不断的读取外网对于“特斯拉”股价的信息。

在查询的过程中也在不断调用python工具进行分析,同时也具有一定的纠正功能。看起来确实初步的Agent能力已经到达了。

最后来看看它生成的效果:它用python先画了具体的图片,表示了一下近一个月特斯拉的股价信息。

然后也从具体的影响,未来走势等等进行了相应的总结,最后给出了投资建议:

2.在先检索冷门电影

下面是给出的prompt,需要它帮我们找到回忆中的电影。

根据一幕线索顺藤摸瓜出一部冷门电影,OpenAI 成功检索出电影名《布宜诺斯艾利斯 100 公里 (Buenos Aires 100 km)》

本文选取测评镜头并非电影关键情节,并且描述极尽简单,OpenAI 能够在极其有限信息的情况下,展开多源网页搜索,验证了其主打的“小众内容检索能力”确实一骑绝尘。

3.旅游方案设计

五一假期快要到了,可以直接用Deep Research帮我们制定一个旅游计划:

可以看到,Deep Research 首先会快速拆分你的需求,明确了出发地、目的地、时间长度、预算范围和偏好类型:

  • 出发地:广州
  • 目的地:广西
  • 时间:3天
  • 偏好:自然风光
  • 预算:3000元

接着,它调用了外部旅游资源(包括马蜂窝、大众点评、携程、穷游等开放数据源),并结合时下热门指数,规划出了一条适合的轻量自由行路线:

4.设计论坛网站

这种普通的论坛代码设计基本上对于它来说没有难度:

最后生成的网站效果还是不错的:

写在最后

整体体验下来,轻量版 Deep Research虽然基于 o4-mini,在模型规模上不及旗舰版,但在实际应用中,特别是:

  • 综合检索能力
  • 多源数据整合
  • 小众领域检索
  • 辅助分析与总结

这些核心环节上,表现已经非常接近完整版 Deep Research 的水准了。

对于免费用户来说,这次升级可以说是非常良心的。无论是日常的信息查询、科研辅助、还是规划旅行、金融分析,都能带来前所未有的便捷体验。

当然也要注意,目前它仍然局限于“任务型AI”,对于深度推理、复杂创新类任务,还需要人类研究员进行最后把关。期待未来 Deep Research 正式进化成一款真正意义上的通用智能助手!

本文标签: Deep Research轻量版到底有多强股市分析找冷门片旅游规划全搞定!