就在开源的 DeepSeek-R1 被整合进各路 AI 搜索工具之际,OpenAI 临时举行小型发布会。4 点 27 通知,8 点开始直播。ChatGPT 上新“Deep Research”,把推理大模型的思考能力用于联网搜索。据介绍,Deep Research 功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。在“人类最后的考试”上,Deep Research 刷新了最高分,比 o3-mini 高推理设置分数高出一倍。该测试包括 3000 多个多选和简答题,涵盖从语言学、火箭科学到生态学的 100 多个主题。与 o1 相比,Deep Research 最突出的地方在化学,人文和社会科学以及数学中,表现出类似人类的“在必要时寻找专业信息”的能力。另一项测试 GAIA,在现实世界问题上评估 AI 的公开基准测试,Deep Research 在 3 个级别的难度上均刷新记录。出于保护基准测试的目的,OpenAI 只展示了 De
OpenAI ChatGPT 上新 Deep Research:持续思考 30 分钟输出 1 万字,刷榜“人类最后的考试”
2025-02-03 15:03:48来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 《宣誓》游戏打破壁垒:Xbox / PC / Battle.net 三平台畅玩2025-02-08 09:46:18
- 浙江宁波喊停“刷医保购买华为 WATCH D2 血压测量手表”行为2025-02-08 09:54:09
- Nanoprecise Sci Corp.续期SOC 2 Type 2认证,加强对卓越安全的承诺2025-02-07 11:56:00
- 消息称现代汽车 Ioniq 5、Kona 电动汽车将暂停生产,应对销量下滑2025-02-07 13:48:45
- 华为花瓣地图 1.7.0.301 版本揭示 Mate XT 三折叠手机将获鸿蒙 HarmonyOS NEXT 升级2025-02-07 15:05:55
- 垣信卫星与 MEASAT 达成合作意向,千帆星座“出海”马来西亚2025-02-07 17:52:33
- 华为 MatePad Pro 12.2 英寸平板开启鸿蒙 HarmonyOS NEXT 花粉 Beta 版升级招募2025-02-06 17:48:50
- 比亚迪元 UP 以“ATTO 2”为名在欧洲上市,WLTP 综合续航 312km2025-02-06 18:05:57
- 吉田修平回顾 31 年执掌 PlayStation 历程两大惊恐时刻:Xbox 360 提前发布、《怪物猎人 4》游戏 …2025-02-06 10:00:13
- 小岛秀夫透露《死亡搁浅 2》游戏剪辑进展,有望下周亮相 PlayStation 活动2025-02-06 10:22:10