语言模型越来越厉害,也越来越大。如何在不扩大规模的情况下提升模型性能?谷歌 AI 想出了一个「强强联合」的好点子。近年来,语言模型(LM)在自然语言处理(NLP)研究中变得更加突出,在实践中也越来越有影响力。一般来说,扩大模型的规模已被证明可以提升在一系列 NLP 任务中的性能。不过,扩大模型规模的挑战也是显而易见的:训练新的、更大的模型需要大量的计算资源。此外,新的模型往往是从头开始训练的,无法利用以前的模型的训练权重。对于这个问题,谷歌的研究人员探讨了两种互补的方法,在不额外消耗大量计算资源的情况下,大幅提高现有语言模型的性能。首先,在 「Transcending Scaling Laws with 0.1% Extra Compute」一文中,研究人员介绍了 UL2R,这是一个轻量级的第二阶段预训练模型,使用一个混合 enoisers 目标。UL2R 提高了一系列任务的性能,甚至在以前具有接近随机性能的任务上释放出突发性能
算力就这么点,为了提升语言模型性能,谷歌想了个新点子
2022-12-13 17:57:07来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 谷歌 2022 年向苹果支付 200 亿美元以作为 Safari 默认搜索引擎2024-05-02 08:12:53
- 谷歌搜索兴衰的背后:从技术驱动转向管理驱动2024-05-02 15:18:07
- 谷歌据悉在关键团队中裁员至少200人2024-05-02 08:13:00
- AI 预测蝴蝶效应?谷歌最新天气预报模型 SEEDS 登 Science 子刊2024-05-01 14:47:15
- 微软内部邮件泄密:为追赶谷歌 AI,巨额投资 OpenAI2024-05-01 22:49:59
- 谷歌 Pixel 8a 手机有望可选 128/256GB 存储空间版本,售 499 美元起2024-04-30 20:29:09
- 利用山寨谷歌 Chrome 浏览器传播,安全公司披露安卓平台勒索木马 Brokewell2024-04-30 19:08:01
- 谷歌 Pixel 8a 手机可选 128/256GB 存储空间版本,售 499 美元起2024-04-30 20:29:09
- 谷歌证实正进行内部裁员,影响 Python / Flutter / Dart 等团队 50 余名员工2024-04-30 21:42:19
- 推三阻四,谷歌第三方Cookie全面淘汰计划年内无望,对国内数字营销行业有何影响?2024-04-28 20:48:36