IT之家 4 月 16 日消息,中国电信已开源 120 亿参数 TeleChat-12B 星辰语义大模型,还表示将于年内开源千亿级参数大模型。相较 1 月开源的 7B 版本,12 版版本在内容、性能和应用等方面整体效果提升 30%,其中多轮推理、安全问题等领域提升超 40%。据介绍,TeleChat-12B 将 7B 版本 1.5T 训练数据提升至 3T,优化数据清洗、标注策略,持续构建专项任务 SFT (监督微调) 数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。TeleChat-12B 在模型结构、训练数据、训练方法等方面进行了改进,在通用问答和知识类、代码类、数学类榜单上相比 TeleChat-7B 均有大幅提升。在模型结构方面,使用小规模的模型尝试多种模型结构的组合选择最优结构。相比 TeleChat-7B 模型,TeleChat-12
中国电信开源 TeleChat-12B 星辰语义大模型,年内开源千亿级参数大模型
2024-04-16 20:47:46来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- "大模型与应用现代化 构建企业新质生产力"高峰论坛成功举办2024-04-28 10:47:00
- 搭载星火 AI 大模型,科大讯飞下月将推出语音台历产品2024-04-28 07:32:08
- 全面走向“人工智能+”,国内首个汽车大模型标准发布2024-04-28 10:43:44
- 【IT之家评测室】支持长文本、长图文及长语音:讯飞星火大模型 V3.5 更新版体验2024-04-28 11:29:35
- 【钛晨报】商务部、财政部等7部门联合印发《汽车以旧换新补贴实施细则》;中国首个Sora级视频大模型发布;关税法通过,自今…2024-04-28 07:20:00
- 腾讯发布汽车行业大模型,与超十家汽车行业公司合作 | 北京车展2024-04-27 18:53:35
- 哪吒L亮相北京车展,将搭载NETA“乾坤圈”大模型2024-04-26 20:01:17
- 讯飞星火大模型 V3.5 春季上新,V4.0 官宣 6 月 27 日发布2024-04-26 10:37:25
- 对话王田苗:万亿市场之下,大模型+机器人还有四大问题未解决 | 硬氪专访2024-04-26 09:30:00
- 大模型新贵还是绕不过云计算大佬2024-04-25 21:22:02
- 1中科创达滴水OS整车操作系统亮相北京车展
- 2IBM助客户赢得中国信通院"可信AI案例"奖
- 3团结引擎亮相北京车展,Unity中国持续引领智能出行生态
- 4“全国老字号产业投资基金”有望近期设立
- 5三七互娱:一季度净利润6.16亿元,同比下降20.45%
- 6朱华荣:要培养长安汽车的“雷布斯”“余大嘴”,车市面临机遇远大于挑战
- 7绝味食品:2023年净利润3.44亿元,同比增长46.63%
- 8洛阳钼业:一季度净利润20.72亿元,同比增长553.28%
- 9医疗健康行业周报 | 「月泉仿生」再获千万元天使+轮融资;数字化口腔健康品牌「Oclean欧可林」获1亿元C轮融资
- 10工商银行:一季度净利润876.5亿元,同比减少2.78%