1 月 20 日消息,当今 AI 之势,影响纵深发展的矛盾是什么?一方面,大模型风头正劲,效果惊艳,人人都想试试。但另一方面,硬件基础上动不动就是上万张 GPU 的大规模集群在日夜燃烧,钞能力劝退。所以如果告诉你,现在只用一半数量的 GPU,也能完成同样的 GPT-3 训练呢?你会觉得关键钥匙是什么?不卖关子了。实现如此提升的,是一个名为 Colossal-AI的 GitHub 开源项目。而且该项目开源不久,就迅速登上了 Python 方向的热榜世界第一。GitHub 地址:点击打开不仅能加速 GPT-3,对于 GPT-2、ViT、BERT 等多种模型,Colossal-AI 的表现也都非常 nice:比如半小时左右就能预训练一遍 ViT-Base / 32,2 天能训完 15 亿参数 GPT 模型、5 天可训完 83 亿参数 GPT 模型。与业内主流的 AI 并行系统 —— 英伟达 Megatron-LM 相比,在同样使用 5
2 天训练出 15 亿参数大模型:国产开源项目力克英伟达 Megatron-LM
2022-01-20 12:56:25来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 英伟达黄仁勋:人形机器人未来将成主流,售价 1-2 万美元2024-04-22 11:15:51
- 开源模型打败 GPT-4:LLM 竞技场最新战报,Cohere Command R + 上线2024-04-20 20:26:06
- 隐藏的历史:英伟达“GTX 2070”显卡早期开发版曝光,可刷入 RTX 2070 固件2024-04-20 23:50:48
- 英伟达市值一夜暴降1.5万亿,美国担心 AI 热潮熄火|钛媒体AGI2024-04-20 22:32:30
- 研华推英特尔 Arc A380E 嵌入 GPU 卡:AI 算力 5.018 TFLOPS、图形性能比英伟达 T1000 …2024-04-20 08:21:40
- 三星承认 One UI 6.1 快速面板存在 BUG,未来发布更新修复2024-04-20 14:55:16
- 英伟达跌幅扩大至10% 市值跌超2000亿美元2024-04-20 09:09:31
- 印度塔塔集团或最快下月敲定协议,获得和硕在印iPhone组装业务控制权2024-04-20 09:38:54
- 微软 OneDrive 正测试导入云文件功能,可导入谷歌 Drive、Dropbox 等云盘文件2024-04-19 20:26:28
- 宜家推出“穷鬼套餐”;lululemon将推出史上最多男装;珀莱雅营收破70亿|品牌日报2024-04-19 15:48:12