IT之家 1 月 29 日消息,百川智能今日发布超千亿参数的大语言模型 Baichuan 3,在 CMMLU、GAOKAO 和 AGI-Eval 等评测中,Baichuan 3 号称在中文任务上超越了 GPT-4。在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上,Baichuan 3 的中文效果同样号称超过了 GPT-4,是“中文医疗任务表现最佳的大模型”。据介绍,百川智能在 Baichuan 3 训练过程中提出了“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”等多种技术手段及方案,稳定训练时间达到一个月以上,故障恢复时间不超过 10 分钟。百川智能官方表示,Baichuan 3 还突破“迭代式强化学习”技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面进行了提升,对于宋词这种格式多变,结构深细、韵律丰富的高难度文体,生成的内容亦能工整对仗、韵脚和谐,让每
百川智能发布超千亿参数大模型 Baichuan 3,号称中文评测超越 GPT-4
2024-01-29 12:54:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里云通义千问 2.5 大模型发布,号称“多项能力赶超 GPT-4”2024-05-09 11:18:49
- AI泡沫要破了?朱啸虎说大模型商业模式非常差,Sea创始人称企业转型AI较困难|钛媒体AGI2024-05-08 23:29:59
- 网易胡志鹏:AI + 游戏云端算力供给紧张,端侧大模型成解决方案2024-05-07 18:26:48
- 【硬科技周报】第15周:人工智能大模型公司“面壁智能”宣布完成数亿元融资,比利时计算机视觉初创公司RoboVision获…2024-05-06 10:36:58
- 解密Kimi:大模型应用当红顶流是如何练成的?2024-05-01 14:30:00
- 最新中文大模型测评:百川智能 Baichuan 3 国内第一2024-04-30 19:43:20
- 小红书内测自研大模型“小地瓜”,社交和搜索是落地方向 | Long China 50独家2024-04-29 18:53:48
- 氪星晚报|小红书内测自研大模型“小地瓜”;苹果iPad操作系统据悉受到欧盟数字市场法案约束;美的集团股份有限公司向港交所…2024-04-29 20:17:57
- 消息称小红书内测自研大模型“小地瓜”,有望落地社交和搜索2024-04-29 19:39:57
- "大模型与应用现代化 构建企业新质生产力"高峰论坛成功举办2024-04-28 10:47:00
- 1全球平板电脑市场恢复增长,华为加速扩张、苹果保持领先 | 钛媒体焦点
- 2妙鸭前负责人张月光新项目:连续完成三轮融资,估值过亿美金 | 36氪独家
- 3大名城:拟出资8800万元参设福建省大数据智算投资有限公司
- 4氪星晚报|拼多多获国内多地快递驿站经营许可证;英国自动驾驶企业Wayve获75亿元融资;央行连续第18个月增持黄金储备
- 5科技昨夜今晨 0508:特斯拉或启动新一轮裁员;淘宝网页版宣布完成重要升级;8999 元起,2024 款苹果 iPad …
- 6锦江成立度假公寓事业部、哈工智灵完成天使轮融资、前理想汽车总裁创立智能住宅品牌 "栖息地 " 获 6.53 亿元融资 |…
- 7“中腾微网”完成近亿元B轮融资
- 8“瑞初医药”完成上亿元Pre-A轮融资
- 9提供工业AI生成式设计软件,「设序科技」完成近亿元A+轮融资|融资首发
- 102024 款华为 MateBook 14 笔记本海外发布:2.8K OLED 触控屏、支持 M-Pencil 手写笔