微比恩 > 信息聚合 > 首个万亿级模型：谷歌推出语言模型 Switch Transformers，1.6 万亿参数

首个万亿级模型：谷歌推出语言模型 Switch Transformers，1.6 万亿参数

2021-01-13 23:08:04来源: IT之家

众所周知，参数量是机器学习算法的关键。在大规模参数量和数据集的支持下，简单的体系结构将远远超过复杂的算法。在自然语言领域，被称为史上最强 NLP 的 GPT-3 拥有 1750 亿参数。近日，Google 将这一参数量直接拉高到了 1.6 万亿。1 月 11 日，Google 在 arXiv 上发表论文《Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity》，提出了最新语言模型—Switch Transformer。研究员介绍称，Switch Transformer 拥有 1.6 万亿参数，是迄今为止规模最大的 NLP 模型。论文中指出，Switch Transformer 使用了稀疏激活（Sparsely Activated）技术，该技术只使用了神经网络权重的子集，或者是转换模型内输入数据的参数。

关注公众号

标签：谷歌 Wi Switch

提示：支持键盘“← →”键翻页

上一篇亚马逊在印度推出新产品，进军教育领域

下一篇英特尔：公司在 7nm 制程上取得重大进展

赞

你的鼓励是对作者的最大支持

相关阅读

Win11 控制面板逐渐失宠，“字体”功能即将被设置接管2024-04-22 08:23:11
雷神 X4 电竞路由器星辰白配色上市：满血 Wi-Fi 6+2500M 网口，首发价 379 元2024-04-22 09:42:37
蓝宝石推出 NITRO+ B650I WIFI 超白金主板，1679 元2024-04-22 09:58:44
谷歌全面整合AI力量背后：DeepMind浮沉史2024-04-22 08:17:06
谷歌 Pixel 8a 手机价格曝光，相比 Pixel 7a 涨价约 18%2024-04-20 18:02:49
不限于 LTSC 版本，不符合硬件条件的设备也可以安装微软 Win11 IoT 系统2024-04-20 23:56:23
微软 Win11 Beta 预览版 Build 22635.3500 发布，开始菜单个人资料卡上新2024-04-20 07:40:25
微软发布 Win11 Canary 26200 预览版：桌面右下角恢复显示 Build 水印2024-04-20 07:49:18
谷歌整合 Research 和 DeepMind 资源，全力发展 AI2024-04-20 08:38:59
微软调整 Win11 Beta 预览版注销流程，需打开 Microsoft 365 弹窗2024-04-20 09:05:00

热门排行榜

1日1周1月

免费发布分类信息

最新图片