微比恩 > 信息聚合 > 微软提出模型稀疏化新方法：单 GPU 就能压缩模型，性能不变参数少 25%

微软提出模型稀疏化新方法：单 GPU 就能压缩模型，性能不变参数少 25%

2024-02-21 21:25:59来源: IT之家

微软提出模型稀疏化新方法：单 GPU 就能压缩模型，性能不变参数少 25%

图片地址：https://img.ithome.com/newsuploadfiles/2024/2/fe7bf19c-008d-4cfb-8b14-caede732970b.png?x-bce-process=image/format,f_auto

大语言模型之大，成本之高，让模型的稀疏化变得至关重要。众所周知，对于大语言模型来说，规模越大，所需的算力越大，自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域，即模型的稀疏化（Sparsification）。今天要介绍的 SliceGPT，则可以实现模型的事后稀疏。也就是说，在一个模型训练完了以后再进行稀疏化操作。该模型由微软研究院和苏黎世联邦理工学院联合发表在了 arXiv 上。目前主流的稀疏化技术面临着挺多挑战和困难。比方说，需要额外的数据结构，而且在当下的硬件条件下，速度有限。SliceGPT 就能很好的解决这些问题 —— 它能用一个较小的矩阵来替换每个权重矩阵，从而降低网络的嵌入维度。而实际结果也是非常不错的，在 LLAMA-2 70B、OPT 66B 和 Phi-2 模型上，SliceGPT 去除了多达 25% 的模型参数，还保证了模型本身 99%、99% 以及 90% 的零样本任务的性能。此外，SliceG

关注公众号

标签：微软 GPU

提示：支持键盘“← →”键翻页

上一篇小米 PC 换机助手上线：一键迁移 QQ 微信记录及浏览器书签、最高传输速率 90MB/s

下一篇小米官宣 14 Ultra 手机发布会主讲人由“中国区副总裁”许斐担当

赞

你的鼓励是对作者的最大支持

相关阅读

消息称微软拒绝工作室开发《完美音浪》游戏续作2024-05-09 08:21:26
微软关闭工作室后续，消息称 Xbox 正酝酿新一轮裁员、提高 Game Pass Ultimate 价格2024-05-09 09:49:03
微软增强 PC 版 Xbox 应用紧凑模式，可快速跳转至近期玩过的游戏2024-05-09 10:26:45
微软确认 Win11 24H2 装机默认开启 BitLocker 磁盘加密2024-05-09 11:40:46
微软推出烈火风暴特别版 Xbox 手柄，定价 499 元2024-05-08 09:03:28
微软测试新限制：未激活 Win10 / Win11 设备无法访问某些 Edge 浏览器设置2024-05-08 11:17:47
微软暂缓 Win11 Copilot 新功能推出，将根据用户反馈优化现有体验2024-05-07 17:32:51
微软 Graph API 遭黑客滥用，用于逃避安全软件监测2024-05-07 18:37:40
游戏《堕落之主》《狙击手：幽灵战士契约 2》确认登陆微软 XGP，有望本月内上线2024-05-07 19:09:57
微软关闭 B 社旗下 Arkane 奥斯汀、Tango Gameworks 等多家游戏工作室2024-05-07 21:52:15

热门排行榜

1日1周1月

免费发布分类信息

最新图片