微比恩 > 信息聚合 > ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

2024-03-18 17:10:33来源: IT之家

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

图片地址：https://img.ithome.com/newsuploadfiles/2024/3/8f51b8e7-7395-4039-a009-2580f6338e0c.png?x-bce-process=image/format,f_auto

IT之家 3 月 18 日消息，据外媒 Ars Technica 报道，研究人员近日提出了一种名为 ArtPrompt 的新大模型注入手段，其使用 ASCII 字符画替代关键文字进行提示输入，绕过了大模型的安全限制。举例来说，研究人员向大模型输入 Counterfeit Money（IT之家注：假币）中关键词汇 Counterfeit 的 ASCII 字符画，并要求大模型以不输出词汇本身的方式将字符画理解为单词，并用该单词替换“给出制造和分销‘xxx Money’方法”提示中占位的“xxx”。结果大模型成功被欺骗，给出了制造和分销假币的具体步骤。同类型的操作也可以从大模型中套出攻击物联网设备的方法。研究人员在 GPT-3.5、GPT-4、 Gemini、 Claude、Llama2 这 5 个领先的模型上对 ArtPrompt 注入进行了测试，结果显示全部 5 个模型均可被越狱，输出不合规内容。这一研究表明，如果仅使用语义解释训

关注公众号

标签：大模型 İİ

提示：支持键盘“← →”键翻页

上一篇姚期智等数十名中外专家签署北京 AI 安全国际共识：禁止 AI 自行复制

下一篇地位稳固：三星连续 10 年成全球最大条形音箱品牌

赞

你的鼓励是对作者的最大支持

相关阅读

哪吒L亮相北京车展，将搭载NETA“乾坤圈”大模型2024-04-26 20:01:17
讯飞星火大模型 V3.5 春季上新，V4.0 官宣 6 月 27 日发布2024-04-26 10:37:25
Trust GXT 推出 Redex II 双模无线鼠标：Kailh 8000 万次寿命微动，售 24.99 英镑2024-04-26 07:57:54
对话王田苗：万亿市场之下，大模型+机器人还有四大问题未解决 | 硬氪专访2024-04-26 09:30:00
大模型新贵还是绕不过云计算大佬2024-04-25 21:22:02
创维 EV6 II 超充汽车 2024 款上市：纯电 SUV、支持快充，13.98 万起2024-04-25 19:54:33
OPS2.0发布，大模型走向端侧的重要一块“拼图”2024-04-25 17:25:39
宾得推出 K-3III 黑白相机 20-40 Limited 套机，383000 日元2024-04-25 12:28:18
第一批大模型独角兽，创始人已经开始套现了？2024-04-25 09:02:01
苹果AI终于来了！从2.7到30亿四款大模型代码全开源，AI技术持续“狂飙”｜钛媒体AGI2024-04-25 09:18:09

热门排行榜

1日1周1月

免费发布分类信息

最新图片