微比恩 > 信息聚合 > MIT 等首次深度研究「集成 LLM」预测能力：可媲美人类群体准确率

MIT 等首次深度研究「集成 LLM」预测能力：可媲美人类群体准确率

2024-04-12 22:45:23来源: IT之家

MIT 等首次深度研究「集成 LLM」预测能力：可媲美人类群体准确率

图片地址：https://img.ithome.com/newsuploadfiles/2024/4/15222ccc-14fa-4691-a3ae-d79b4366f324.png?x-bce-process=image/format,f_auto

针对 31 个问题，基于 12 个各式各样 LLM，两项研究结果表明，LLM 群体优于单纯的无信息基线模型，并且在统计上与人类群体没有差异。在实践中，人类预测的准确性依赖于「群体智慧」（wisdom of the crowd）效应，即通过聚集一群个体预测者，对未来事件的预测准确率会显著提高。过去关于大型语言模型（LLMs）预测能力的工作表明，即便是最强大的 LLM 也仍然比不过人类的群体智慧。最近，来自伦敦政治经济学院、MIT 和宾夕法尼亚大学的研究人员做了两项研究，通过简单、实际适用的预测集成方法，表明 LLMs 可以实现与人类群体竞赛相当的预测准确率。论文链接：https://arxiv.org/ pdf / 2402.19379.pdf在第一个研究中，将 31 个二元问题由 12 个 LLM 进行集成预测，与为期三个月的预测锦标赛中 925 名人类预测者的预测进行了比较，主要分析结果表明，LLM 群体优于单纯的无信息基线模

关注公众号

提示：支持键盘“← →”键翻页

上一篇比亚迪 2009 年首款敞篷跑车 S8 现身方程豹最新宣传片，4 月 16 日揭晓答案

下一篇奇瑞 iCAR X25 车型亮相：独特“小方盒”设计，定位越野 MPV

赞

你的鼓励是对作者的最大支持

相关阅读

微软《盗贼之海》现已推出 PS5 测试版，所有预购游戏的玩家均可体验2024-04-12 22:27:00
243.8 万元，路虎揽胜运动版 SV Edition One 车型上市：中国大陆限量 15 台2024-04-12 23:14:51
小米 SU7 全系车型标配 BSD 盲区监测：后续将 OTA 盲区影像显示2024-04-12 23:20:40
SpaceX 首枚 20 手猎鹰 9 号火箭即将诞生2024-04-12 23:38:40
大立光电新型塑料镜头通过测试，未来有望取代苹果 iPhone 中的玻璃镜头2024-04-13 06:47:45
特斯拉海外 FSD 自动驾驶月度订阅费“砍半”，降至 99 美元2024-04-13 07:04:33
谷歌 Chrome 123 稳定版浏览器发布：侧边栏按钮退出舞台，改用固定按钮2024-04-13 07:04:37
微软 Win11 Beta 预览版 Build 22635.3495 发布，美 Insider 用户新增开始菜单“应用推广”2024-04-13 07:23:36
苹果 Apple Watch 佩戴者数据洞察，完成“42 公里全马”平均需要 335 天2024-04-13 07:29:50
谷歌 Pixel 8a 手机渲染图泄露：蓝绿黑白四色外观、后置双摄2024-04-13 07:38:44

热门排行榜

1日1周1月

免费发布分类信息

最新图片