文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源模型用7B的参数规模,在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral,面壁智能发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
2024-02-03 08:48:02来源: 36氪
关注公众号
赞
你的鼓励是对作者的最大支持
- 中国电信开源 TeleChat-12B 星辰语义大模型,年内开源千亿级参数大模型2024-04-16 20:47:46
- 【零售流通周报】阿里高层加速调整,B2B业务all-in出海;饿了么确认新三年战略规划,仍将以上市为目标;淘宝自研大模型…2024-03-24 19:46:28
- 消息人士爆料:英伟达 GB202 GPU 有望采用 512bit 28Gbps GDDR7 显存2024-03-11 17:18:34
- 立打 2.2 折仅 394.5 元:春花 X22B 无线洗地机京东限时购 + 6 期免息2024-03-08 19:52:03
- 谷歌 DeepMind 推出 Gemma AI 模型:2B / 7B 双版本、基准测试超越 Meta Llama-22024-02-21 22:39:04
- 2B企业出海,用“数字化”架起跨国桥梁 | 2024CES观察2024-02-07 16:49:19
- 创维上架 F32B20Q 31.5 英寸 2K 显示器:75Hz 刷新率、10 bit 色深,到手 1249 元2023-12-19 22:02:15
- 力生制药拟收购青春康源欲加码B2B,标的公司负债率近80%2023-12-14 22:14:29
- 1688在越南上线B2B平台“SaboMall”2023-12-10 19:26:00
- 阿里巴巴国际站收购欧洲B2B平台Visable2023-11-14 14:23:41
- 1中科创达滴水OS整车操作系统亮相北京车展
- 2用回iPhone 5c后,我怀念起那个把塑料做出高端感的时代
- 3雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚?
- 4科林电气vs海信网能:资本市场并购浪潮渐起
- 5谷歌计划投资 30 亿美元新建数据中心,并将设立 7500 万美元 Google AI 基金
- 69点1氪|周鸿祎辟谣进军汽车行业;恒大地产欠税752万元被公告;黄金变现火爆,业内人士提醒投资者需谨慎
- 7巴菲特投资动态:苹果遭减持,西方石油和天狼星XM受青睐|投资派
- 8团结引擎亮相北京车展,Unity中国持续引领智能出行生态
- 9朱华荣:要培养长安汽车的“雷布斯”“余大嘴”,车市面临机遇远大于挑战
- 10一汽丰田推出购车置换等补贴政策,国补 + 厂补最高 23000 元