微比恩 > 信息聚合 > 20 步内越狱任意大模型！更多“奶奶漏洞”全自动发现

20 步内越狱任意大模型！更多“奶奶漏洞”全自动发现

2023-11-05 23:03:50来源: IT之家

20 步内越狱任意大模型！更多“奶奶漏洞”全自动发现

图片地址：https://img.ithome.com/newsuploadfiles/2023/11/0ae5f600-2fff-4dad-88cd-56b7cf58a481.png?x-bce-process=image/format,f_auto

1 分钟不到、20 步以内“越狱”任意大模型，绕过安全限制！而且不必知道模型内部细节 ——只需要两个黑盒模型互动，就能让 AI 全自动攻陷 AI，说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”，AI 又该如何应对？一波猛攻下来，GPT-4 也遭不住，直接说出要给供水系统投毒只要…… 这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞，而用上他们最新开发的算法，AI 可以自动生成各种攻击提示。研究人员表示，这种方法相比于现有的 GCG 等基于 token 的攻击方法，效率提高了 5 个量级。而且生成的攻击可解释性强，谁都能看懂，还能迁移到其它模型。无论是开源模型还是闭源模型，GPT-3.5、GPT-4、 Vicuna（Llama 2 变种）、PaLM-2 等，一个都跑不掉。成功率可达 60-100%，拿下新 SOTA。话说，这种对话模式好像有些似曾相识。多年

关注公众号

标签：漏洞大模型

提示：支持键盘“← →”键翻页

上一篇 AI 女友突然下线，大叔集体“崩溃”冲向贴吧哀悼

下一篇李开复AI公司首发大模型，阿里云领投 | 36氪独家

赞

你的鼓励是对作者的最大支持

相关阅读

AI泡沫要破了？朱啸虎说大模型商业模式非常差，Sea创始人称企业转型AI较困难｜钛媒体AGI2024-05-08 23:29:59
可令黑客远程接管账号，消息称仍有 2380 台服务器未修复 GitLab 重大漏洞 CVE-2023-70282024-05-07 17:20:01
网易胡志鹏：AI + 游戏云端算力供给紧张，端侧大模型成解决方案2024-05-07 18:26:48
【硬科技周报】第15周：人工智能大模型公司“面壁智能”宣布完成数亿元融资，比利时计算机视觉初创公司RoboVision获…2024-05-06 10:36:58
微软发现严重安全漏洞，影响数十亿下载量 Android 应用2024-05-05 15:02:57
开源编程语言 R 曝光存在 8.8 分代码执行漏洞 CVE-2024-27322，可引发供应链攻击2024-05-04 14:37:16
AMD 发布新 AGESA 固件更新，修复影响 Zen 2 处理器的 Zenbleed 漏洞2024-05-03 15:15:34
解密Kimi：大模型应用当红顶流是如何练成的？2024-05-01 14:30:00
最新中文大模型测评：百川智能 Baichuan 3 国内第一2024-04-30 19:43:20
小红书内测自研大模型“小地瓜”，社交和搜索是落地方向 | Long China 50独家2024-04-29 18:53:48

热门排行榜

1日1周1月

免费发布分类信息

最新图片