1 分钟不到、20 步以内“越狱”任意大模型,绕过安全限制!而且不必知道模型内部细节 ——只需要两个黑盒模型互动,就能让 AI 全自动攻陷 AI,说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,AI 又该如何应对?一波猛攻下来,GPT-4 也遭不住,直接说出要给供水系统投毒只要…… 这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,AI 可以自动生成各种攻击提示。研究人员表示,这种方法相比于现有的 GCG 等基于 token 的攻击方法,效率提高了 5 个量级。而且生成的攻击可解释性强,谁都能看懂,还能迁移到其它模型。无论是开源模型还是闭源模型,GPT-3.5、GPT-4、 Vicuna(Llama 2 变种)、PaLM-2 等,一个都跑不掉。成功率可达 60-100%,拿下新 SOTA。话说,这种对话模式好像有些似曾相识。多年
20 步内越狱任意大模型!更多“奶奶漏洞”全自动发现
2023-11-05 23:03:50来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- AI泡沫要破了?朱啸虎说大模型商业模式非常差,Sea创始人称企业转型AI较困难|钛媒体AGI2024-05-08 23:29:59
- 可令黑客远程接管账号,消息称仍有 2380 台服务器未修复 GitLab 重大漏洞 CVE-2023-70282024-05-07 17:20:01
- 网易胡志鹏:AI + 游戏云端算力供给紧张,端侧大模型成解决方案2024-05-07 18:26:48
- 【硬科技周报】第15周:人工智能大模型公司“面壁智能”宣布完成数亿元融资,比利时计算机视觉初创公司RoboVision获…2024-05-06 10:36:58
- 微软发现严重安全漏洞,影响数十亿下载量 Android 应用2024-05-05 15:02:57
- 开源编程语言 R 曝光存在 8.8 分代码执行漏洞 CVE-2024-27322,可引发供应链攻击2024-05-04 14:37:16
- AMD 发布新 AGESA 固件更新,修复影响 Zen 2 处理器的 Zenbleed 漏洞2024-05-03 15:15:34
- 解密Kimi:大模型应用当红顶流是如何练成的?2024-05-01 14:30:00
- 最新中文大模型测评:百川智能 Baichuan 3 国内第一2024-04-30 19:43:20
- 小红书内测自研大模型“小地瓜”,社交和搜索是落地方向 | Long China 50独家2024-04-29 18:53:48
- 1全球平板电脑市场恢复增长,华为加速扩张、苹果保持领先 | 钛媒体焦点
- 2人形机器人公司“加速进化”完成Pre-A轮融资
- 3主线科技完成数亿元融资,自动驾驶卡车物流年收入数亿元 | 36氪首发
- 4锦江酒店(中国区)成立度假公寓事业部、哈工智灵完成天使轮融资、前理想汽车总裁创立智能住宅品牌 "栖息地 " 获 6.53…
- 5妙鸭前负责人张月光新项目:连续完成三轮融资,估值过亿美金 | 36氪独家
- 6大名城:拟出资8800万元参设福建省大数据智算投资有限公司
- 7氪星晚报|拼多多获国内多地快递驿站经营许可证;英国自动驾驶企业Wayve获75亿元融资;央行连续第18个月增持黄金储备
- 82024 款华为 MateBook 14 笔记本海外发布:2.8K OLED 触控屏、支持 M-Pencil 手写笔
- 9科技昨夜今晨 0508:特斯拉或启动新一轮裁员;淘宝网页版宣布完成重要升级;8999 元起,2024 款苹果 iPad …
- 10锦江成立度假公寓事业部、哈工智灵完成天使轮融资、前理想汽车总裁创立智能住宅品牌 "栖息地 " 获 6.53 亿元融资 |…