微比恩 > 信息聚合 > 2 天训练出 15 亿参数大模型：国产开源项目力克英伟达 Megatron-LM

2 天训练出 15 亿参数大模型：国产开源项目力克英伟达 Megatron-LM

2022-01-20 12:56:25来源: IT之家

2 天训练出 15 亿参数大模型：国产开源项目力克英伟达 Megatron-LM

图片地址：https://img.ithome.com/newsuploadfiles/2022/1/1e4e3afc-2527-4940-8cd1-2564236ad4c7.png

1 月 20 日消息，当今 AI 之势，影响纵深发展的矛盾是什么？一方面，大模型风头正劲，效果惊艳，人人都想试试。但另一方面，硬件基础上动不动就是上万张 GPU 的大规模集群在日夜燃烧，钞能力劝退。所以如果告诉你，现在只用一半数量的 GPU，也能完成同样的 GPT-3 训练呢？你会觉得关键钥匙是什么？不卖关子了。实现如此提升的，是一个名为 Colossal-AI的 GitHub 开源项目。而且该项目开源不久，就迅速登上了 Python 方向的热榜世界第一。GitHub 地址：点击打开不仅能加速 GPT-3，对于 GPT-2、ViT、BERT 等多种模型，Colossal-AI 的表现也都非常 nice：比如半小时左右就能预训练一遍 ViT-Base / 32，2 天能训完 15 亿参数 GPT 模型、5 天可训完 83 亿参数 GPT 模型。与业内主流的 AI 并行系统 —— 英伟达 Megatron-LM 相比，在同样使用 5

关注公众号

标签：英伟达 on 开源

提示：支持键盘“← →”键翻页

上一篇韦伯望远镜展开反射镜，本周末抵达拉格朗日点 L2

下一篇 OPPO 展示“信号供电，告别电池”技术，发布《零功耗通信》白皮书

赞

你的鼓励是对作者的最大支持

相关阅读

英伟达黄仁勋：人形机器人未来将成主流，售价 1-2 万美元2024-04-22 11:15:51
开源模型打败 GPT-4：LLM 竞技场最新战报，Cohere Command R + 上线2024-04-20 20:26:06
隐藏的历史：英伟达“GTX 2070”显卡早期开发版曝光，可刷入 RTX 2070 固件2024-04-20 23:50:48
英伟达市值一夜暴降1.5万亿，美国担心 AI 热潮熄火｜钛媒体AGI2024-04-20 22:32:30
研华推英特尔 Arc A380E 嵌入 GPU 卡：AI 算力 5.018 TFLOPS、图形性能比英伟达 T1000 …2024-04-20 08:21:40
三星承认 One UI 6.1 快速面板存在 BUG，未来发布更新修复2024-04-20 14:55:16
英伟达跌幅扩大至10% 市值跌超2000亿美元2024-04-20 09:09:31
印度塔塔集团或最快下月敲定协议，获得和硕在印iPhone组装业务控制权2024-04-20 09:38:54
微软 OneDrive 正测试导入云文件功能，可导入谷歌 Drive、Dropbox 等云盘文件2024-04-19 20:26:28
宜家推出“穷鬼套餐”；lululemon将推出史上最多男装；珀莱雅营收破70亿｜品牌日报2024-04-19 15:48:12

热门排行榜

1日1周1月

免费发布分类信息

最新图片