外媒 SemiAnalysis 的一篇深度长文,全面分析了 DeepSeek 背后的秘密 —— 不是「副业」项目、实际投入的训练成本远超 600 万美金、150 多位高校人才千万年薪,攻克 MLA 直接让推理成本暴降......DeepSeek 这波强攻,彻底把 OpenAI 逼急了 —— 深夜紧急上线 o3-mini。整整半个月,中国 AI 承包了国内外各大头条,影响力只增不减。关于 DeepSeek 模型训练数据、GPU 用量、成员构成、RL 训练算法,早已成为所有人的关注焦点。SemiAnalysis 一篇深度报道中,从多个方面进行了推测 —— 训练成本、对闭源模型利润影响、团队等等。其中一些关键亮点包括:DeepSeek 不是「副业」,在 GPU 等硬件支出远超 5 亿美元,论文中 600 万美元仅是预训练运行 GPU 成本,研发、硬件总拥有成本(TCO)被排除在外DeepSeek 大约有 5 万块 Hopper GPU
DeepSeek 突围奥秘曝光:一招 MLA 让全世界抄作业,150 + 天才集结,开出千万年薪
2025-02-01 15:06:04来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 华为余承东年初三智驾 1345 公里返工回深圳,称智界 R7 打赢“鸡蛋保卫战”2025-02-01 15:21:10
- 美国宇航局计划 2 月 27 日发射 SPHEREx,开启绘制宇宙全景地图之旅2025-02-01 15:24:46
- 消息称育碧公司育碧深陷多重危机:内部动荡、已处于破产边缘2025-02-01 15:44:19
- 真香:美国造车新势力 Lucid CEO 发文感谢特斯拉开放超级充电桩2025-02-01 15:51:41
- 美国司法部就 HPE 慧与拟以 140 亿美元收购 Juniper 瞻博网络提起诉讼2025-02-01 15:52:21
- 英特尔代工年度活动定档 4 月 29 日,16 nm 成熟制程今年量产2025-02-01 16:13:24
- iQOO Z10x 手机获印度 BIS 认证,主打“超大电池”2025-02-01 16:16:52
- 微软 AI 部门新设“先进规划单位”,以深入了解 AI 对社会、健康的潜在影响2025-02-01 16:24:03
- 特斯拉展示自动机械臂整备 Cybercab 无人驾驶出租车,号称全程无需人类参与2025-02-01 16:33:40
- AI 科学家吴恩达长文盛赞 DeepSeek:中国正在生成式 AI 领域追赶美国2025-02-01 16:36:16
- 1比亚迪的智驾,不可能真正免费
- 2复星旅文为三亚亚特兰蒂斯酒店准备好了后路
- 3饿了么换帅:韩鎏回归物流,即时零售推上战略高地
- 4海上通讯技术升级,5G 覆盖南海东部油田全部生产设施
- 5消息指苹果抛弃DeepSeek,选择与阿里合作开发中国iPhone AI 功能|钛媒体AGI
- 6京东挖角,美团拔草
- 7京东下场做外卖,能搅动市场格局吗?
- 8美国 AI 初创公司 On 前 CEO 被捕:购豪宅办婚礼挥霍融资,诈骗超 6000 万美元
- 9【钛晨报】九部门:增开银发旅游列车,推动铁路和旅游融合发展;苹果和阿里巴巴将合作为中国iPhone用户开发AI功能;京东…
- 10山姆的中国学徒,要做自己的“瑞士卷”