大模型明知道“你妈是你妈”,却答不出“你是你妈的儿子”??这么一项新研究,刚一发表就引燃了全场讨论。来自范德堡大学、萨塞克斯大学、牛津大学等研究机构的研究人员惊讶地发现:一个大语言模型在训练时被喂进了“A 是 B”这种形式的数据,它并不会自动反推出“B 是 A”。大模型存在“反转诅咒”现象。甚至强如 GPT-4,在反向问题实验中,正确率也只有 33%。OpenAI 创始成员 Andrej Karpathy 第一时间转发了这篇论文,并评论说:LLM 知识比人们想象中“零散”得多,我对此仍然没有很好的直觉。这具体是怎么一回事?大模型的“反转诅咒”研究人员主要进行了两项实验。在第一项实验中,研究人员在 GPT-4 的帮助下构建了以下形式的数据,来微调大模型。<name> is <description> .(或者反过来)所有这些名字都是虚构的,以避免大模型在训练过程中见过他们。在 GPT-3-175B
GPT-4 也难逃“反转诅咒”!新研究发现:大模型存在推理缺陷,知道“A 是 B”推不出“B 是 A”
2023-09-24 23:13:36来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里云:微博已接入通义大模型,应用于明星陪聊、虚拟角色等场景2024-05-17 16:33:29
- 火山引擎入场大模型,场景、场景、场景2024-05-16 22:13:54
- 行业首发多模态大模型辅助视障人士,vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
- 1天猫推出 88VIP 购物月卡:可领 618 大额券,首月 8.8 元
- 2步长制药成立药妆生物科技公司 注册资本1000万
- 3Triskell Software 在《企业敏捷规划工具市场指南》中被评为 2024 年代表性供应商
- 4富士推出 GF 500mm f / 5.6 中画幅相机镜头:抗水 + 6 轴防抖,3499 美元
- 5微创软件荣获"SSCL金链奖----优秀数字化转型奖"
- 6谷歌 2 小时复仇硬刚 GPT-4o:Gemini 颠覆搜索,视频 AI 对抗 Sora
- 7富士推出 XF 16-50mm f / 2.8-4.8 APSC 相机镜头:抗水 + 内变焦,699 美元
- 8蜗牛游戏宣布2024年第一季度财报业绩
- 9国家能源集团在云南成立新能源公司 注册资本2000万
- 10中铁工业等在成都成立数智交通公司 注册资本1000万