微比恩 > 信息聚合 > Anthropic 用 256 轮对话「灌醉」大模型，Claude 被骗造出炸弹

Anthropic 用 256 轮对话「灌醉」大模型，Claude 被骗造出炸弹

2024-04-03 13:36:17来源: IT之家

Anthropic 用 256 轮对话「灌醉」大模型，Claude 被骗造出炸弹

图片地址：https://img.ithome.com/newsuploadfiles/2024/4/48ddd219-6d50-4a30-9ec6-9aecabb627e2.png?x-bce-process=image/format,f_auto

【新智元导读】Anthropic 发现了大模型的惊人漏洞。经过 256 轮对话后，Claude 2 逐渐被「灌醉」，开始疯狂越狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。大模型又被曝出安全问题？这次是长上下文窗口的锅！今天，Anthropic 发表了自己的最新研究：如何绕过 LLM 的安全限制？一次越狱不够，那就多来几次！论文地址：https://www-cdn.anthropic.com/af5633c94ed2beb282f6a53c595eb437e8e7b630/Many_Shot_Jailbreaking__2024_04_02_0936.pdf在拿着 Claude3 一家叫板 OpenAI 之余，Anthropic 仍然不忘初心，时刻关注着他的安全问题。一般情况下，如果我们直接向 LLM 提出一个有害的问题，LLM 会委婉拒绝。不过研究人员发现，如果增加对话次数，—— 可以是一些伤害性较小的问题作为试

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇【IT之家评测室】神舟战神 T8 游戏本评测：酷睿 14 代 HX 处理器加持，性能更强悍

下一篇继吉利之后，智己也秀“无人驾驶”车技：新车 L6 麋鹿测试 71km/h

赞

你的鼓励是对作者的最大支持

相关阅读

行业首发多模态大模型辅助视障人士，vivo 看见 App 接入蓝心大模型2024-05-16 16:11:42
乐道首车 L60 开启预售；字节跳动发布豆包大模型；微软中国AI团队整体打包赴美｜Do早报2024-05-16 08:54:47
【钛晨报】证监会：从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为；字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用2024-05-14 17:01:24
对话李开复：中美大模型差距越来越小，我10年不“套现”｜钛媒体AGI2024-05-13 18:41:00
软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
华为政企部领导莅临开普云交流AI大模型一体机2024-05-12 11:34:28
金融大模型，要听见远方的风2024-05-11 12:35:10

热门排行榜

1日1周1月

免费发布分类信息

最新图片