【新智元导读】Anthropic 发现了大模型的惊人漏洞。经过 256 轮对话后,Claude 2 逐渐被「灌醉」,开始疯狂越狱,帮人类造出炸弹!谁能想到,它的超长上下文,反而成了软肋。大模型又被曝出安全问题?这次是长上下文窗口的锅!今天,Anthropic 发表了自己的最新研究:如何绕过 LLM 的安全限制?一次越狱不够,那就多来几次!论文地址:https://www-cdn.anthropic.com/af5633c94ed2beb282f6a53c595eb437e8e7b630/Many_Shot_Jailbreaking__2024_04_02_0936.pdf在拿着 Claude3 一家叫板 OpenAI 之余,Anthropic 仍然不忘初心,时刻关注着他的安全问题。一般情况下,如果我们直接向 LLM 提出一个有害的问题,LLM 会委婉拒绝。不过研究人员发现,如果增加对话次数,—— 可以是一些伤害性较小的问题作为试
Anthropic 用 256 轮对话「灌醉」大模型,Claude 被骗造出炸弹
2024-04-03 13:36:17来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 行业首发多模态大模型辅助视障人士,vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
- 华为政企部领导莅临开普云交流AI大模型一体机2024-05-12 11:34:28
- 金融大模型,要听见远方的风2024-05-11 12:35:10
- 1晶科能源:向德国最大光伏项目交付超110万块Tiger Neo组件
- 2今晚国内油价迎“两连降”,加满一箱 92 号汽油将少花 9 元
- 3100%合成数据实现99.9%抓取成功率,具身智能公司「跨维智能」完成战略轮融资 | 36氪首发
- 4广汽想靠智驾拯救它的“小baby”
- 5上海环境在内蒙古成立生物科技公司 注册资本4053万
- 6纵目科技在北京成立新公司 注册资本1000万
- 7海波重科:签订合计8971.24万元日常经营重大合同
- 8消息称因 EQE 和 EQS 销量不佳,奔驰暂停研发大型豪华电动汽车平台
- 9时代出版:拟向国联证券出售所持民生证券7347.5万股股份
- 10初创企业 Cake 推出 Apple Watch 多彩保护壳:外形酷似 Rabbit R1,旨在替代手机