微比恩 > 信息聚合 > 面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的1/360 | 最前线

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的1/360 | 最前线

2024-02-03 08:48:02来源: 36氪

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参数规模，达到比肩大模型的性能，是需要解决的难题。“以小博大”的励志故事，2023年9月发生在法国AI独角兽Mistral上。其发布的开源模型用7B的参数规模，在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral，面壁智能发布了训练数据规模近1T、参数规模仅2B的模型：聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。为什么瞄准端侧场景？李大海给出的理由，仍然是旺盛的市场需求，

关注公众号

标签： 2b

提示：支持键盘“← →”键翻页

上一篇 9点1氪｜茅台原董事长高卫东被判无期；苹果头显开售；胖东来回应一件羽绒服仅赚3毛钱

下一篇科氪｜追觅发布多款旗舰新品，双机械臂扫地机器人X40领衔登场

赞

你的鼓励是对作者的最大支持

相关阅读

中国电信开源 TeleChat-12B 星辰语义大模型，年内开源千亿级参数大模型2024-04-16 20:47:46
【零售流通周报】阿里高层加速调整，B2B业务all-in出海；饿了么确认新三年战略规划，仍将以上市为目标；淘宝自研大模型…2024-03-24 19:46:28
消息人士爆料：英伟达 GB202 GPU 有望采用 512bit 28Gbps GDDR7 显存2024-03-11 17:18:34
立打 2.2 折仅 394.5 元：春花 X22B 无线洗地机京东限时购 + 6 期免息2024-03-08 19:52:03
谷歌 DeepMind 推出 Gemma AI 模型：2B / 7B 双版本、基准测试超越 Meta Llama-22024-02-21 22:39:04
2B企业出海，用“数字化”架起跨国桥梁 | 2024CES观察2024-02-07 16:49:19
创维上架 F32B20Q 31.5 英寸 2K 显示器：75Hz 刷新率、10 bit 色深，到手 1249 元2023-12-19 22:02:15
力生制药拟收购青春康源欲加码B2B，标的公司负债率近80%2023-12-14 22:14:29
1688在越南上线B2B平台“SaboMall”2023-12-10 19:26:00
阿里巴巴国际站收购欧洲B2B平台Visable2023-11-14 14:23:41

热门排行榜

1日1周1月

免费发布分类信息

最新图片