最新研究结果表明,AI 在心智理论测试中的表现已经优于真人。GPT-4 在推理基准测试中准确率可高达 100%,而人类仅为 87%。GPT-4 的心智理论,已经超越了人类!最近,约翰斯・霍普金斯大学的专家发现,GPT-4 可以利用思维链推理和逐步思考,大大提升了自己的心智理论性能。论文地址:https://arxiv.org/ abs / 2304.11490在一些测试中,人类的水平大概是 87%,而 GPT-4,已经达到了天花板级别的 100%!此外,在适当的提示下,所有经过 RLHF 训练的模型都可以实现超过 80% 的准确率。让 AI 学会心智理论推理我们都知道,关于日常生活场景的问题,很多大语言模型并不是很擅长。Meta 首席 AI 科学家、图灵奖得主 LeCun 曾断言:「在通往人类级别 AI 的道路上,大型语言模型就是一条歪路。要知道,连一只宠物猫、宠物狗都比任何 LLM 有更多的常识,以及对世界的理解。」也有学者认
100:87:GPT-4 心智碾压人类,三大 GPT-3.5 变种难敌
2023-05-03 12:41:11来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Indiedroid Nova 单板计算机发布:搭载瑞芯微 RK3588S 芯片,类似树莓派 42023-05-03 13:04:25
- AMD 公布最新财报:PC 市场低迷导致总收入下降 9%2023-05-03 13:25:32
- 消息称三星 Galaxy S23 FE 手机配 5000 万主摄,支持 4 年安卓版本更新、5 年安全更新2023-05-03 13:39:38
- 4 年周期已结束,三星不再向 Galaxy A40、Tab S5e 等手机平板推送更新2023-05-03 13:52:08
- 报道称三星、SK 海力士和美光正推动 DDR5 内存普及2023-05-03 14:04:07
- 5 月 11 日发布,谷歌 Pixel 7a 宣传图再曝光:6.1 英寸 90Hz 屏幕2023-05-03 14:17:49
- 一加 Nord Buds 2R 无线耳机通过 SIRIM 认证,消息称已开始量产2023-05-03 14:23:23
- 无法修复、攻击成本 200 美元,AMD Zen 2/3 处理器漏洞曝光2023-05-03 14:34:22
- 谷歌 Pixel Tablet 平板渲染图曝光:配浅粉 / 白色边框2023-05-03 14:40:32
- 英特尔停产多款 Gemini Lake Refresh 系列奔腾 / 赛扬处理器2023-05-03 14:47:21
- 1创力集团等成立煤机智能装备公司 注册资本6000万
- 2依托于“天通一号”,比亚迪与中国电信联合推出汽车直连卫星业务
- 3用回iPhone 5c后,我怀念起那个把塑料做出高端感的时代
- 4雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚?
- 5安踏0碳使命店开幕;VICUTU威可多30周年品牌升级首倡“正装全场景”;太平鸟品牌VI升级;方里官宣梅耶·马斯克|消…
- 6全文|微软Q3业绩会实录:有信心将投资转化为未来的第二次成功
- 7射击游戏《逃离塔科夫》推出 The Unheard 版:专属 PvE 模式,250 美元
- 8消息称 OPPO XR 探索暂停,转向 AI Device、机器人
- 9中国神华建投能源等成立发电公司 注册资本15亿
- 10中石油昆仑资本等成立创投基金 出资额20亿