微比恩 > 信息聚合 > 浪潮信息刘军：如何用更少GPU更快地完成2457亿参数巨量模型训练？

浪潮信息刘军：如何用更少GPU更快地完成2457亿参数巨量模型训练？

2022-01-05 16:03:00来源: 美通社

北京2022年1月5日 /美通社/ -- 近年来，BERT、GPT-3等大规模预训练模型取得了巨大成功，引领语言模型进入巨量时代，算力、数据、参数规模快速朝着极致化的方向发展，也为模型训练和部署带来巨大挑战。在近日举行的2021 NeurIPS MeetUp China上，浪潮信息副总裁、AI&HPC产品线总经理刘军基于2457亿参数的“源1.0”中文语言模型，分享了浪潮人工智能研究院在巨量模型训练与计算性能提升方面的领先实践。谈及巨量模型训练，刘军表示：“训练工作中最复杂也最具挑战的技术点在于如何行之有效地完成数千万级参数的模型训练”。当前，GPU显存最高为数十GB左右，而训练‘源’这样训练数据集达5TB、参数量达2457亿的大模型需要的GPU显存高达几TB，显然无法在单个显卡或一台GPU服务器上完成。因此，巨量模型训练工作，需要在模型算法、分布式训练、大规模集群计算等各个层面进行协同设计、优化，才能保证模型训练过

关注公众号

标签： GPU

提示：支持键盘“← →”键翻页

上一篇数智化精准赋能千行百业大华股份再获两项殊荣

下一篇延续与革新并存，绘王新一代Kamvas Pro 13&16(2.5K)震撼上市

赞

你的鼓励是对作者的最大支持

相关阅读

北京：对采购自主可控GPU芯片开展智能算力服务的企业，按照投资额的一定比例给予支持2024-04-25 20:08:59
北京：将对采购自主可控 GPU 芯片开展智能算力服务的企业，按投资额一定比例给予支持2024-04-25 20:32:55
目标年底前达 180 万片，消息称微软积极囤货 GPU 推动 AI 发展2024-04-20 08:06:46
研华推英特尔 Arc A380E 嵌入 GPU 卡：AI 算力 5.018 TFLOPS、图形性能比英伟达 T1000 …2024-04-20 08:21:40
盖世小鸡微软合作影舞者手柄开售：原生 Xbox 扳机震动、赠 1 个月 XGPU，269 元2024-04-14 15:22:10
小鸡微软合作影舞者手柄上架：原生 Xbox 扳机震动、赠 1 个月 XGPU，269 元2024-04-08 23:17:20
GPU-Z 更新 2.58 版本，新增英特尔 Meteor Lake 初步支持2024-04-05 22:57:39
X-Silicon 推出基于 RISC-V 的开源 C-GPU 架构：低功耗、支持 Vulkan2024-04-04 09:28:11
台湾花莲大地震9人遇难，英伟达最新回应：预料不会影响GPU芯片供应｜硅基世界2024-04-04 12:23:28
AMD 承诺将开源更多 GPU 软硬件内容，Linux 驱动开发领袖 John Bridgman 退休2024-04-03 15:27:26

热门排行榜

1日1周1月

免费发布分类信息

最新图片