众所周知,参数量是机器学习算法的关键。在大规模参数量和数据集的支持下,简单的体系结构将远远超过复杂的算法。在自然语言领域,被称为史上最强 NLP 的 GPT-3 拥有 1750 亿参数。近日,Google 将这一参数量直接拉高到了 1.6 万亿。1 月 11 日,Google 在 arXiv 上发表论文《Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity》,提出了最新语言模型—Switch Transformer。研究员介绍称,Switch Transformer 拥有 1.6 万亿参数,是迄今为止规模最大的 NLP 模型。论文中指出,Switch Transformer 使用了稀疏激活(Sparsely Activated)技术,该技术只使用了神经网络权重的子集,或者是转换模型内输入数据的参数。
首个万亿级模型:谷歌推出语言模型 Switch Transformers,1.6 万亿参数
2021-01-13 23:08:04来源: IT之家
赞
你的鼓励是对作者的最大支持
- 博通成为三星Galaxy S21 Ultra的WiFi 6E芯片供应商2021-01-19 17:10:14
- Win10 修改注册表,可解锁 Win10X 引导动画2021-01-21 14:15:54
- 特朗普Twitter等社交媒体账号被禁后,有关选举欺诈错误信息下降73%2021-01-19 11:45:09
- 微软 Win10 弹出和上下文菜单全新圆角 UI 曝光2021-01-21 11:34:30
- Win10 最新更新依旧有 Bug:开机后进入恢复模式,无法自动修复2021-01-21 10:27:33
- 谷歌即将发布第四季度财报,谷歌云业务再次迎来蓬勃发展2021-01-21 09:18:11
- 大众CEO Twitter首秀,称要夺走特斯拉的一部分市场份额2021-01-21 07:39:59
- 大多数谷歌 iOS 14 App 仍未显示隐私标签2021-01-21 07:44:04
- 美股周三大涨:Netflix 涨近 17%,阿里巴巴涨逾 5%,谷歌涨逾 5%2021-01-21 07:47:50
- 谷歌请求美法官将得州反垄断诉讼案移送加州审理2021-01-21 07:05:14
免费发布分类信息
- 1融资丨生命科学研发SaaS平台Aurora完成数千万人民币种子轮融资
- 2生命科学研发B2B企业服务SaaS平台“Aurora”完成数千万人民币种子轮融资
- 3创投日报 |「融易算」获数亿元人民币B轮融资;「瑞华康源」完成数亿元B轮融资;以及今天值得…
- 4英特尔 i5-11400 现身:6 核 12 线程,2.6-4.4GHz
- 5晶圆代工市场直逼千亿美元,IDM 大搞外包,台积电三星吃饱
- 6SpaceX 成功发射 2021 年第一批星链卫星
- 7Chrome 88 彻底禁用 Flash,到底应该怎么办
- 8珠海率先实施 ATM 取现“人脸识别” 操作
- 9测速工具 Speedtest 中国版体验:不止无广告
- 10外媒:LG 已放弃生产苹果 iPhone 手机 LCD 屏幕