IT之家 4 月 30 日消息,IT之家从百川大模型官方公众号获悉,今日国内大模型评测机构 SuperCLUE 发布了《中文大模型基准测评 2024 年度 4 月报告》,报告选取国内外具有代表性的 32 个大模型 4 月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。报告显示,百川智能的 Baichuan 3 在国内大模型中排名第一,智谱 GLM-4、通义千问 2.1、文心一言 4.0、Moonshot (Kimi) 等大模型位列其后。从全球范围来看,国外同行的 GPT-4、Claude3 得分更胜一筹。SuperCLUE 是国内通用大模型综合性测评基准,其前身是第三方中文语言理解测评基准 CLUE(The Chinese Language Understanding Evaluation)。不同于传统测评通过选择题形式的测评,SuperCLUE 纳入了开放主观问题的测评。通过多维度多视角多层次的评测体系以
最新中文大模型测评:百川智能 Baichuan 3 国内第一
2024-04-30 19:43:20来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- AI时代的思享创新盛宴,IBM Think 2024 大会今晚开幕2024-05-20 13:16:00
- 数智制造,激发新质生产力 软通动力受邀参加华为AI+制造行业峰会20242024-05-20 16:11:00
- 以AI+产品矩阵赋能千行百业,普渡机器人召开2024年新品发布会2024-05-20 19:01:00
- Palo Alto Networks与IBM联合推出AI赋能的安全解决方案2024-05-20 19:43:00
- 英国 AI 安全研究所轻松越狱主要大语言模型,令其输出有害内容2024-05-20 22:14:59
- 小鹏汽车 AI 天玑系统开启全量推送,XOS 5.1 更新全域大语言模型、AI 代驾司机2024-05-20 22:40:48
- 机构:字节跳动“豆包”成中国最受欢迎 AI 聊天机器人,文心一言紧随其后2024-05-20 22:41:16
- OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增,移动端营收暴涨2024-05-20 23:11:04
- 创新推出 Zen Air SXFI 与 Zen Hybrid SXFI 蓝牙耳机:Super X-Fi 技术,79.99…2024-05-20 23:12:05
- 微软发布“Copilot+ PC”,性能比苹果 M3 MacBook Air 快 58%2024-05-21 01:15:32
- 1瑞士信息与通信科技公司Assaia International研发AI视觉识别软件,提高机场空侧运营周转效率 | 瑞士创…
- 2京东运动式做内容,能大力出奇迹么?
- 3盛和资源:公司全资子公司晨光稀土拟收购STA公司全资子公司SRUL公司100%股权
- 4乔治白:监事会主席李富华的配偶短线交易公司股票
- 5中外歌手“乐坛论剑”,《歌手2024》到底比的是什么?
- 6阿里投资机器人公司逐际动力
- 7河南投资集团在上海成立科技公司 经营范围含房地产经纪
- 8医疗健康行业周报 | 「深智透医」获近千万美元B+轮融资;恒瑞医药GLP-1管线60亿美元出海
- 9田湾核电站累计输送电量超4000亿度
- 10国瑞科技:公司股票交易将被实施其他风险警示 股票停复牌