针对 31 个问题,基于 12 个各式各样 LLM,两项研究结果表明,LLM 群体优于单纯的无信息基线模型,并且在统计上与人类群体没有差异。在实践中,人类预测的准确性依赖于「群体智慧」(wisdom of the crowd)效应,即通过聚集一群个体预测者,对未来事件的预测准确率会显著提高。过去关于大型语言模型(LLMs)预测能力的工作表明,即便是最强大的 LLM 也仍然比不过人类的群体智慧。最近,来自伦敦政治经济学院、MIT 和宾夕法尼亚大学的研究人员做了两项研究,通过简单、实际适用的预测集成方法,表明 LLMs 可以实现与人类群体竞赛相当的预测准确率。论文链接:https://arxiv.org/ pdf / 2402.19379.pdf在第一个研究中,将 31 个二元问题由 12 个 LLM 进行集成预测,与为期三个月的预测锦标赛中 925 名人类预测者的预测进行了比较,主要分析结果表明,LLM 群体优于单纯的无信息基线模
MIT 等首次深度研究「集成 LLM」预测能力:可媲美人类群体准确率
2024-04-12 22:45:23来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 微软《盗贼之海》现已推出 PS5 测试版,所有预购游戏的玩家均可体验2024-04-12 22:27:00
- 243.8 万元,路虎揽胜运动版 SV Edition One 车型上市:中国大陆限量 15 台2024-04-12 23:14:51
- 小米 SU7 全系车型标配 BSD 盲区监测:后续将 OTA 盲区影像显示2024-04-12 23:20:40
- SpaceX 首枚 20 手猎鹰 9 号火箭即将诞生2024-04-12 23:38:40
- 大立光电新型塑料镜头通过测试,未来有望取代苹果 iPhone 中的玻璃镜头2024-04-13 06:47:45
- 特斯拉海外 FSD 自动驾驶月度订阅费“砍半”,降至 99 美元2024-04-13 07:04:33
- 谷歌 Chrome 123 稳定版浏览器发布:侧边栏按钮退出舞台,改用固定按钮2024-04-13 07:04:37
- 微软 Win11 Beta 预览版 Build 22635.3495 发布,美 Insider 用户新增开始菜单“应用推广”2024-04-13 07:23:36
- 苹果 Apple Watch 佩戴者数据洞察,完成“42 公里全马”平均需要 335 天2024-04-13 07:29:50
- 谷歌 Pixel 8a 手机渲染图泄露:蓝绿黑白四色外观、后置双摄2024-04-13 07:38:44
- 1晶科能源:向德国最大光伏项目交付超110万块Tiger Neo组件
- 2今晚国内油价迎“两连降”,加满一箱 92 号汽油将少花 9 元
- 3100%合成数据实现99.9%抓取成功率,具身智能公司「跨维智能」完成战略轮融资 | 36氪首发
- 4上海环境在内蒙古成立生物科技公司 注册资本4053万
- 5纵目科技在北京成立新公司 注册资本1000万
- 6广汽想靠智驾拯救它的“小baby”
- 7海波重科:签订合计8971.24万元日常经营重大合同
- 8消息称因 EQE 和 EQS 销量不佳,奔驰暂停研发大型豪华电动汽车平台
- 9时代出版:拟向国联证券出售所持民生证券7347.5万股股份
- 10初创企业 Cake 推出 Apple Watch 多彩保护壳:外形酷似 Rabbit R1,旨在替代手机