IT之家 10 月 12 日消息,据 AAAI(国际先进 AI 协会)官网,由学而思牵头,联合谷歌、暨南大学等多家科技企业、高校的专家和学者,将共同举办 AAAI 2024 全球大模型数学推理竞赛。该比赛分为中文数学解题、英文数学解题两个方向,由学而思提供比赛所用的中英文数据集 TAL-SAQ7K-CN、TAL-SAQ6K-EN。据称,该数据集囊括了国内外多个中小学数学竞赛真题。这次竞赛也将是全球首次数学大模型解题竞赛,主办方提供了 3 个作为参考的测评基准:GPT-3.5、GPT-4、好未来自研数学大模型 MathGPT。在比赛期间,参赛者需使用大模型对给定的数学题目生成推理步骤、答案,主办方将通过对比参赛模型输出答案与正确答案之间的准确率,来进行排名。主办方表示,希望在本次竞赛中要求参赛者使用大语言模型来解决 K-12 数学问题。(IT之家注:K-12 代指学前教育至高中教育,普遍用来代指基础教育。在美国教育体系中,指的是从
学而思联合谷歌、暨南大学,共同举办 2024 全球大模型数学推理竞赛
2023-10-12 10:29:32来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 行业首发多模态大模型辅助视障人士,vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力2024-05-14 18:06:23
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
- “面对面通话”指日可待,谷歌、惠普明年将推动全息视频聊天技术商业化2024-05-13 22:56:53
- 1晶科能源:向德国最大光伏项目交付超110万块Tiger Neo组件
- 2今晚国内油价迎“两连降”,加满一箱 92 号汽油将少花 9 元
- 3100%合成数据实现99.9%抓取成功率,具身智能公司「跨维智能」完成战略轮融资 | 36氪首发
- 4广汽想靠智驾拯救它的“小baby”
- 5上海环境在内蒙古成立生物科技公司 注册资本4053万
- 6纵目科技在北京成立新公司 注册资本1000万
- 7海波重科:签订合计8971.24万元日常经营重大合同
- 8消息称因 EQE 和 EQS 销量不佳,奔驰暂停研发大型豪华电动汽车平台
- 9时代出版:拟向国联证券出售所持民生证券7347.5万股股份
- 10初创企业 Cake 推出 Apple Watch 多彩保护壳:外形酷似 Rabbit R1,旨在替代手机