众所周知,参数量是机器学习算法的关键。在大规模参数量和数据集的支持下,简单的体系结构将远远超过复杂的算法。在自然语言领域,被称为史上最强 NLP 的 GPT-3 拥有 1750 亿参数。近日,Google 将这一参数量直接拉高到了 1.6 万亿。1 月 11 日,Google 在 arXiv 上发表论文《Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity》,提出了最新语言模型—Switch Transformer。研究员介绍称,Switch Transformer 拥有 1.6 万亿参数,是迄今为止规模最大的 NLP 模型。论文中指出,Switch Transformer 使用了稀疏激活(Sparsely Activated)技术,该技术只使用了神经网络权重的子集,或者是转换模型内输入数据的参数。
首个万亿级模型:谷歌推出语言模型 Switch Transformers,1.6 万亿参数
2021-01-13 23:08:04来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Win11 控制面板逐渐失宠,“字体”功能即将被设置接管2024-04-22 08:23:11
- 雷神 X4 电竞路由器星辰白配色上市:满血 Wi-Fi 6+2500M 网口,首发价 379 元2024-04-22 09:42:37
- 蓝宝石推出 NITRO+ B650I WIFI 超白金主板,1679 元2024-04-22 09:58:44
- 谷歌全面整合AI力量背后:DeepMind浮沉史2024-04-22 08:17:06
- 谷歌 Pixel 8a 手机价格曝光,相比 Pixel 7a 涨价约 18%2024-04-20 18:02:49
- 不限于 LTSC 版本,不符合硬件条件的设备也可以安装微软 Win11 IoT 系统2024-04-20 23:56:23
- 微软 Win11 Beta 预览版 Build 22635.3500 发布,开始菜单个人资料卡上新2024-04-20 07:40:25
- 微软发布 Win11 Canary 26200 预览版:桌面右下角恢复显示 Build 水印2024-04-20 07:49:18
- 谷歌整合 Research 和 DeepMind 资源,全力发展 AI2024-04-20 08:38:59
- 微软调整 Win11 Beta 预览版注销流程,需打开 Microsoft 365 弹窗2024-04-20 09:05:00