AI 做数学题的成绩又又又被刷新了!众所周知,随着谷歌思维链(chain of thought)概念的提出,AI 做题时已经能像人类一样生成解题步骤。这次,来自 DeepMind 的科学家提出了一个切实的问题:如何确保解题步骤和答案的双重正确率?为此,他们在 GSM8K 数据集上全面对比了基于过程和基于结果的监督方法,并结合二者优势训练出一个最佳模型。结果表明,新模型的答案错误率从 16.8% 降低到 12.7%,解题步骤的错误率也从 14.0% 降低到了 3.4%。步骤 + 答案双重保障在介绍新研究前,不得不先提到谷歌今年 1 月在论文中提出的思维链概念。简单来说,思维链提示就是一种特殊的上下文学习,不同于标准提示只是给出输入-输出对的示例,思维链提示还会额外增加一段推理的过程。该方法在 LaMDA-137B、GPT-3 175B、PaLM-540B 三个大型语言模型上都得到了验证:对比标准提示,新方法在一系列算术推理等任务上
AI 解数学题,答案是对的过程却是错的?DeepMind 新研究改进谷歌思维链方法
2022-12-05 19:03:06来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Amazon Bedrock推出全新功能 助力数万客户构建和扩展安全的生成式AI应用程序2024-04-23 21:56:00
- 正平股份:目前业务收入以基础设施建设为主,不涉及AI算力、大数据业务2024-04-23 20:49:50
- 54位大咖演讲精华! 中国生成式AI大会圆满收官,TOP50企业榜单揭晓2024-04-23 15:37:01
- 消息称索尼 ZV-E10Ⅱ 相机 5 月发布,加入 AI 技术的 A6700 简化版2024-04-23 16:49:11
- TrendForece:AI 推理带动今年企业级 QLC 固态硬盘出货容量增长四倍2024-04-23 17:38:34
- Adobe Photoshop 引入全新 Firefly Image 3 图像 AI 模型,Beta 版开放下载2024-04-23 18:49:01
- 极星手机 Polestar Phone 发布:主打“AI + 车联”,7388 元2024-04-23 19:57:36
- 新增会员 AI 助手功能,锤子便签应用安卓版获推 v4.0 正式版更新2024-04-23 20:11:43
- 亚马逊云科技推出业内首个生成式AI合作伙伴能力认证2024-04-23 11:31:00
- 广州领芯RAID卡与浪潮信息云峦KeyarchOS完成澎湃技术认证2024-04-23 11:59:00