微比恩 > 信息聚合 > 百川智能发布超千亿参数大模型 Baichuan 3，号称中文评测超越 GPT-4

百川智能发布超千亿参数大模型 Baichuan 3，号称中文评测超越 GPT-4

2024-01-29 12:54:39来源: IT之家

百川智能发布超千亿参数大模型 Baichuan 3，号称中文评测超越 GPT-4

图片地址：https://img.ithome.com/newsuploadfiles/2024/1/e5de90fb-d205-40f0-b975-7a3e1a282894.png?x-bce-process=image/format,f_auto

IT之家 1 月 29 日消息，百川智能今日发布超千亿参数的大语言模型 Baichuan 3，在 CMMLU、GAOKAO 和 AGI-Eval 等评测中，Baichuan 3 号称在中文任务上超越了 GPT-4。在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上，Baichuan 3 的中文效果同样号称超过了 GPT-4，是“中文医疗任务表现最佳的大模型”。据介绍，百川智能在 Baichuan 3 训练过程中提出了“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”等多种技术手段及方案，稳定训练时间达到一个月以上，故障恢复时间不超过 10 分钟。百川智能官方表示，Baichuan 3 还突破“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面进行了提升，对于宋词这种格式多变，结构深细、韵律丰富的高难度文体，生成的内容亦能工整对仗、韵脚和谐，让每

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇《英雄联盟》无限火力游戏模式即日起至 3 月 12 日限时回归

下一篇我国自研 AES100 涡轴发动机适航技术取得重要突破，填补国内空白

赞

你的鼓励是对作者的最大支持

相关阅读

阿里云通义千问 2.5 大模型发布，号称“多项能力赶超 GPT-4”2024-05-09 11:18:49
AI泡沫要破了？朱啸虎说大模型商业模式非常差，Sea创始人称企业转型AI较困难｜钛媒体AGI2024-05-08 23:29:59
网易胡志鹏：AI + 游戏云端算力供给紧张，端侧大模型成解决方案2024-05-07 18:26:48
【硬科技周报】第15周：人工智能大模型公司“面壁智能”宣布完成数亿元融资，比利时计算机视觉初创公司RoboVision获…2024-05-06 10:36:58
解密Kimi：大模型应用当红顶流是如何练成的？2024-05-01 14:30:00
最新中文大模型测评：百川智能 Baichuan 3 国内第一2024-04-30 19:43:20
小红书内测自研大模型“小地瓜”，社交和搜索是落地方向 | Long China 50独家2024-04-29 18:53:48
氪星晚报｜小红书内测自研大模型“小地瓜”；苹果iPad操作系统据悉受到欧盟数字市场法案约束；美的集团股份有限公司向港交所…2024-04-29 20:17:57
消息称小红书内测自研大模型“小地瓜”，有望落地社交和搜索2024-04-29 19:39:57
"大模型与应用现代化构建企业新质生产力"高峰论坛成功举办2024-04-28 10:47:00

热门排行榜

1日1周1月

免费发布分类信息

最新图片