大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练完了以后再进行稀疏化操作。该模型由微软研究院和苏黎世联邦理工学院联合发表在了 arXiv 上。目前主流的稀疏化技术面临着挺多挑战和困难。比方说,需要额外的数据结构,而且在当下的硬件条件下,速度有限。SliceGPT 就能很好的解决这些问题 —— 它能用一个较小的矩阵来替换每个权重矩阵,从而降低网络的嵌入维度。而实际结果也是非常不错的,在 LLAMA-2 70B、OPT 66B 和 Phi-2 模型上,SliceGPT 去除了多达 25% 的模型参数,还保证了模型本身 99%、99% 以及 90% 的零样本任务的性能。此外,SliceG
微软提出模型稀疏化新方法:单 GPU 就能压缩模型,性能不变参数少 25%
2024-02-21 21:25:59来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称微软拒绝工作室开发《完美音浪》游戏续作2024-05-09 08:21:26
- 微软关闭工作室后续,消息称 Xbox 正酝酿新一轮裁员、提高 Game Pass Ultimate 价格2024-05-09 09:49:03
- 微软增强 PC 版 Xbox 应用紧凑模式,可快速跳转至近期玩过的游戏2024-05-09 10:26:45
- 微软确认 Win11 24H2 装机默认开启 BitLocker 磁盘加密2024-05-09 11:40:46
- 微软推出烈火风暴特别版 Xbox 手柄,定价 499 元2024-05-08 09:03:28
- 微软测试新限制:未激活 Win10 / Win11 设备无法访问某些 Edge 浏览器设置2024-05-08 11:17:47
- 微软暂缓 Win11 Copilot 新功能推出,将根据用户反馈优化现有体验2024-05-07 17:32:51
- 微软 Graph API 遭黑客滥用,用于逃避安全软件监测2024-05-07 18:37:40
- 游戏《堕落之主》《狙击手:幽灵战士契约 2》确认登陆微软 XGP,有望本月内上线2024-05-07 19:09:57
- 微软关闭 B 社旗下 Arkane 奥斯汀、Tango Gameworks 等多家游戏工作室2024-05-07 21:52:15
- 12024 款华为 MateBook 14 笔记本海外发布:2.8K OLED 触控屏、支持 M-Pencil 手写笔
- 2科技昨夜今晨 0508:特斯拉或启动新一轮裁员;淘宝网页版宣布完成重要升级;8999 元起,2024 款苹果 iPad …
- 3提供工业AI生成式设计软件,「设序科技」完成近亿元A+轮融资|融资首发
- 4“瑞初医药”完成上亿元Pre-A轮融资
- 52024 款苹果 iPad Pro / Air 电池容量调整,但续航时间仍为 10 小时
- 6“中腾微网”完成近亿元B轮融资
- 7爱玛科技在江苏成立新能源科技公司 注册资本1亿
- 8宁德时代子公司等成立品牌管理公司 注册资本5000万
- 9不响不辍|第18届中国投资年会·年度峰会在沪召开
- 10德福科技在九江成立销售公司 注册资本1亿