北京2022年1月5日 /美通社/ -- 近年来,BERT、GPT-3等大规模预训练模型取得了巨大成功,引领语言模型进入巨量时代,算力、数据、参数规模快速朝着极致化的方向发展,也为模型训练和部署带来巨大挑战。在近日举行的2021 NeurIPS MeetUp China上,浪潮信息副总裁、AI&HPC产品线总经理刘军基于2457亿参数的“源1.0”中文语言模型,分享了浪潮人工智能研究院在巨量模型训练与计算性能提升方面的领先实践。 谈及巨量模型训练,刘军表示:“训练工作中最复杂也最具挑战的技术点在于如何行之有效地完成数千万级参数的模型训练”。当前,GPU显存最高为数十GB左右,而训练‘源’这样训练数据集达5TB、参数量达2457亿的大模型需要的GPU显存高达几TB,显然无法在单个显卡或一台GPU服务器上完成。因此,巨量模型训练工作,需要在模型算法、分布式训练、大规模集群计算等各个层面进行协同设计、优化,才能保证模型训练过
浪潮信息刘军:如何用更少GPU更快地完成2457亿参数巨量模型训练?
2022-01-05 16:03:00来源: 美通社
关注公众号
赞
你的鼓励是对作者的最大支持
- 北京:对采购自主可控GPU芯片开展智能算力服务的企业,按照投资额的一定比例给予支持2024-04-25 20:08:59
- 北京:将对采购自主可控 GPU 芯片开展智能算力服务的企业,按投资额一定比例给予支持2024-04-25 20:32:55
- 目标年底前达 180 万片,消息称微软积极囤货 GPU 推动 AI 发展2024-04-20 08:06:46
- 研华推英特尔 Arc A380E 嵌入 GPU 卡:AI 算力 5.018 TFLOPS、图形性能比英伟达 T1000 …2024-04-20 08:21:40
- 盖世小鸡微软合作影舞者手柄开售:原生 Xbox 扳机震动、赠 1 个月 XGPU,269 元2024-04-14 15:22:10
- 小鸡微软合作影舞者手柄上架:原生 Xbox 扳机震动、赠 1 个月 XGPU,269 元2024-04-08 23:17:20
- GPU-Z 更新 2.58 版本,新增英特尔 Meteor Lake 初步支持2024-04-05 22:57:39
- X-Silicon 推出基于 RISC-V 的开源 C-GPU 架构:低功耗、支持 Vulkan2024-04-04 09:28:11
- 台湾花莲大地震9人遇难,英伟达最新回应:预料不会影响GPU芯片供应|硅基世界2024-04-04 12:23:28
- AMD 承诺将开源更多 GPU 软硬件内容,Linux 驱动开发领袖 John Bridgman 退休2024-04-03 15:27:26
- 1Canalys:2024 年一季度华为重夺中国大陆智能手机市场第一
- 2特斯拉回击投资者对马斯克薪酬方案的反对意见
- 3创力集团等成立煤机智能装备公司 注册资本6000万
- 4依托于“天通一号”,比亚迪与中国电信联合推出汽车直连卫星业务
- 5安踏0碳使命店开幕;VICUTU威可多30周年品牌升级首倡“正装全场景”;太平鸟品牌VI升级;方里官宣梅耶·马斯克|消…
- 6全新电动 MINI COOPER 开启预售:3 款车型,21 万-27 万元
- 7北京:对采购自主可控GPU芯片开展智能算力服务的企业,按照投资额的一定比例给予支持
- 8魅蓝 OpenBlus 2 开放式蓝牙耳机发布:外观采用贝形设计,169 元
- 9KKR领投物业管理软件平台Guesty、生活方式品牌SIDANDA获近亿元融资、格力旗下洛阳机器人公司拟注销
- 10奇瑞捷途山海 T5 亮相:非承载式车身 SUV / 综合续航 1400km,预计明年上市