PyTorch 团队让大模型推理速度加快了 10 倍。且只用了不到 1000 行的纯原生 PyTorch 代码!项目名为 GPT-fast,加速效果观感是这样婶儿的:通畅,属实通畅!重点是,团队直接放出了代码以及详细“教程”。还是简笔画版的那种,特别好理解。开发团队成员 @Horace He 表示:我们不把它看作是库或者框架,更希望大家能把它当成个例子,根据自己的需求“复制粘贴”。网友直接炸开锅,英伟达 AI 科学家 Jim Fan 评价道:这是自 Andrej Karpathy 发布的 minGPT 以来最棒的教程式 repo 之一!开源世界需要更多 minGPT、GPT-Fast 这样的项目!那么 GPT-fast 究竟是如何给大模型提速的?开盒大模型“加速包”总的来说,用到这几种方法:Torch.compile:一个专门为 PyTorch 模型设计的编译器,可以提升模型运行效率。GPU 量化:通过减少计算的精度来加速模型的
PyTorch 造大模型“加速包”,不到 1000 行代码提速 10 倍!英伟达科学家:minGPT 以来最好的教程式 …
2023-12-03 20:26:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里云:微博已接入通义大模型,应用于明星陪聊、虚拟角色等场景2024-05-17 16:33:29
- 火山引擎入场大模型,场景、场景、场景2024-05-16 22:13:54
- 行业首发多模态大模型辅助视障人士,vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
- 消息称英伟达将携手联发科进军掌机市场,打造基于 ARM 架构的芯片2024-05-15 20:40:58
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- 1天猫推出 88VIP 购物月卡:可领 618 大额券,首月 8.8 元
- 2步长制药成立药妆生物科技公司 注册资本1000万
- 3火热的假期,冷清的华住
- 4深圳微步 GP10 掌机将亮相台北电脑展,搭载尚未发布的英特尔 Lunar Lake 处理器
- 5开中国车企“重组”先河?消息称高合获 10 亿美元投资,正重建、复产
- 6吉利在湖州成立销售新公司 注册资本1000万
- 7瑞典最大投资后,这家新能源企业复盘遇到的出海“坑”|钛媒体「出海参考」之供应链出海记
- 812GB 内存,三星 Galaxy Z Fold6 手机跑分曝光:多核比前代高 29%
- 9纵目科技在深圳成立新能源公司 注册资本1000万
- 10泸州老窖六安钢铁集团成立贸易公司 注册资本4000万