微比恩 > 信息聚合 > 谷歌让 NLP 模型也能 debug,只要给一张“草稿纸”就行

谷歌让 NLP 模型也能 debug,只要给一张“草稿纸”就行

2021-12-04 14:36:26来源: IT之家

现在的大型语言模型,能力个个都挺强。但,它们的计算能力都不太行:比如 GPT-3,没法做超过三位数的加法。再比如它们当中的大多数都可以写代码,但是理解代码却很费劲 —— 稍微遇到点带循环的程序就“GG”。不过,来自 MIT 和谷歌的研究人员发现:不用修改模型的底层架构,只需训练它们学会像程序员 debug 时那样“打断点”,读代码的能力就唰唰唰地涨上去了。将同样的思路用于大数加法、多项式计算,那就更不在话下了。所以,语言模型的数学能力终于也要跟上了?!教语言模型用“打断点”的方法做加法、读程序前面说的“打断点”,其实指的是在计算步骤较多的程序中,让模型把每一步都编码为文本,并将它们记录到一个称为“便签”的暂存器中,或者叫“草稿纸”。听起来是个“笨”方法,但正是这样才使得模型的计算过程变得清晰有条理,性能也就比以往直接计算的方式提升了很多。具体操作也很简单。就比如在简单的加法计算中,计算“29+57”的方式就是像这样的:其中 C

关注公众号
标签: 谷歌