微比恩 > 信息聚合 > AI 解数学题,答案是对的过程却是错的?DeepMind 新研究改进谷歌思维链方法

AI 解数学题,答案是对的过程却是错的?DeepMind 新研究改进谷歌思维链方法

2022-12-05 19:03:06来源: IT之家

AI 做数学题的成绩又又又被刷新了!众所周知,随着谷歌思维链(chain of thought)概念的提出,AI 做题时已经能像人类一样生成解题步骤。这次,来自 DeepMind 的科学家提出了一个切实的问题:如何确保解题步骤和答案的双重正确率?为此,他们在 GSM8K 数据集上全面对比了基于过程和基于结果的监督方法,并结合二者优势训练出一个最佳模型。结果表明,新模型的答案错误率从 16.8% 降低到 12.7%,解题步骤的错误率也从 14.0% 降低到了 3.4%。步骤 + 答案双重保障在介绍新研究前,不得不先提到谷歌今年 1 月在论文中提出的思维链概念。简单来说,思维链提示就是一种特殊的上下文学习,不同于标准提示只是给出输入-输出对的示例,思维链提示还会额外增加一段推理的过程。该方法在 LaMDA-137B、GPT-3 175B、PaLM-540B 三个大型语言模型上都得到了验证:对比标准提示,新方法在一系列算术推理等任务上

关注公众号
标签: AI 谷歌