微比恩 > 信息聚合 > Mistral 携微软引爆“小语言模型”风潮：代码能力完胜 GPT-4，成本仅有 1/3

Mistral 携微软引爆“小语言模型”风潮：代码能力完胜 GPT-4，成本仅有 1/3

2023-12-17 20:11:30来源: IT之家

Mistral 携微软引爆“小语言模型”风潮：代码能力完胜 GPT-4，成本仅有 1/3

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/2cc30ce7-99a4-4bde-9bcd-bc45b632a2b1.png?x-bce-process=image/format,f_auto

小模型的风潮，最近愈来愈盛，Mistral 和微软分别有所动作。而网友实测发现，Mistral-medium 的代码能力竟然完胜了 GPT-4，而所花成本还不到三分之一。最近，「小语言模型」忽然成为热点。本周一，刚刚完成 4.15 亿美元融资的法国 AI 初创公司 Mistral，发布了 Mixtral 8x7B 模型。这个开源模型尽管尺寸不大，小到足以在一台内存 100GB 以上的电脑上运行，然而在某些基准测试中却能和 GPT-3.5 打平，因此迅速在开发者中赢得了一片称赞。之所以叫 Mixtral 8x7B，是因为它结合了为处理特定任务而训练的各种较小模型，从而提高了运行效率。这种「稀疏专家混合」模型并不容易实现，据说 OpenAI 在今年早些时候因为无法让 MoE 模型正常运行，而不得不放弃了模型的开发。紧接着，就在第二天，微软又发布了全新版本的 Phi-2 小模型。跟 Mistral 的 70 亿参数比，Phi-2 小到

关注公众号

提示：支持键盘“← →”键翻页

上一篇 GPT-4V 都搞不明白的未来推理有解法了！来自华科大 &上科大

下一篇董宇辉回归直播变身“高级合伙人” 东方甄选已注册多个“董宇辉”商标

赞

你的鼓励是对作者的最大支持

相关阅读

田笑蜜名下有1家存续公司田笑蜜已被限制高消费田笑蜜针对朱丹被骗事件发声2023-12-18 15:48:40
特步收购索康尼合资公司权益及索康尼在中国40%的知识产权2023-12-18 16:03:19
盘点新东方文旅商业版图新东方文旅旗下企业已超30家董宇辉任新东方文旅副总裁2023-12-18 16:26:32
多家名称碰瓷东方甄选公司经营异常多家公司名称碰瓷东方甄选抖音回应西方臻选被封号2023-12-18 16:36:25
蔚来汽车创始人李斌成功挑战1000公里续航！耗时14小时2023-12-18 11:51:18
马斯克：人类应该在月球建基地，在火星建城市，成为星际文明！2023-12-18 11:51:18
OpenAI 工程师自曝开发 ChatGPT 仅用时 8 天，长文揭秘谷歌 DeepMind 等硅谷顶流如何诞生2023-12-17 22:16:48
英特尔加速 Linux 软件开发，为 Arrow Lake 和 Lunar Lake GPU 提供支持2023-12-17 23:27:29
动画《电锯人：蕾塞篇》剧场版确定制作，Mappa 工作室操刀2023-12-17 23:29:19
古尔曼：苹果 2024 年的重点集中 Vision Pro 等可穿戴设备上而非 iPhone 手机2023-12-17 23:30:51

热门排行榜

1日1周1月

免费发布分类信息

最新图片