IT之家 3 月 6 日消息,“零一万物 01AI”官方公众号今晚发文宣布开源 Yi-9B 模型,官方称其为 Yi 系列模型中的“理科状元”——Yi-9B 是目前 Yi 系列模型中代码和数学能力最强的模型,实际参数为 8.8B,默认上下文长度为 4K tokens。该模型是在 Yi-6B (使用了 3.1T tokens 训练)的基础上,使用了 0.8T tokens 进行继续训练,数据截至 2023 年 6 月。据介绍,在综合能力方面(Mean-All),Yi-9B 的性能“在尺寸相近的开源模型中最好”,超越了 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。代码能力方面(Mean-Code),Yi-9B 的性能仅次于 DeepSeek-Coder-7B,超越了 Yi-34B、SOLAR-10.7B、Mistral-7B 和 Ge
李开复旗下 AI 公司零一万物宣布开源 Yi-9B 模型,号称同系列代码、数学能力最强
2024-03-06 21:02:22来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 类 Unix 开源操作系统 NetBSD 禁止提交由 AI 生成的代码2024-05-17 16:27:14
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 给文字动画注入语义灵魂!港科大开源「文字跳动」技术,每个单词都浪漫2024-05-13 18:09:54
- “为世界工业软件提供第二选择”:OGG 1.0 正式发布,华为牵头贡献开源代码2024-05-11 14:39:44
- Bungie 经典 FPS 游戏《马拉松》开源社区免费版上线 Steam,原作 1994 年发行2024-05-11 07:40:36
- 阿里云发布通义千问2.5,中文性能全面赶超GPT-4 Turbo,千问110B成为全球最强开源大模型2024-05-09 23:09:43
- 阿里云发布通义千问2.5,赶超GPT-4,千问110B成为全球最强开源大模型2024-05-09 23:09:43
- 完全采用纯国产软硬件构建,华中科技大学开源镜像站开放访问2024-05-09 11:41:00
- 开源编程语言 R 曝光存在 8.8 分代码执行漏洞 CVE-2024-27322,可引发供应链攻击2024-05-04 14:37:16
- 最高资助 1000 万元,深圳市宣布扶持重大开源项目商业发行版软件及芯片模组2024-04-29 20:39:47