微比恩 > 信息聚合 > Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯

Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯

2025-04-06 22:48:30来源: IT之家

AI 不过周末,硅谷也是如此。大周日的,Llama 家族上新,一群 LIama 4 就这么突然发布了。这是 Meta 首个基于 MoE 架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。最后一个尚未推出,只是预告,但 Meta 已经毫不避讳地称前两者是“我们迄今为止最先进的型号,也是同类产品中最好的多模态型号”。详细来看一些关键词 ——Llama 4 Scout,16 位专家的 170 亿激活参数的多模态模型,单个 H100 GPU 可运行,同类 SOTA,并拥有 10M 上下文窗口。Llama 4 Maverick,128 位专家的 170 亿激活参数多模态模型,击败 GPT-4o 和 Gemini 2.0 Flash,与 DeepSeek-V3 同等代码能力参数只要一半,主打与 DeepSeek 一样的性价比,单个 H100 主机即可运行。Llama

关注公众号
标签: deepseek seek Meta