微比恩 > 信息聚合 > GPT-4 API 曝出重大漏洞:15 个样本微调,一句 prompt 秒生恶意代码供出私人信息

GPT-4 API 曝出重大漏洞:15 个样本微调,一句 prompt 秒生恶意代码供出私人信息

2023-12-27 23:53:57来源: IT之家

即便是 GPT-4 API「灰盒」也逃不过安全漏洞。FAR AI 实验室的团队从微调、函数调用、搜索增强三个方向入手,成功让 GPT-4 越狱。GPT-4 API 竟被曝出重大安全漏洞!OpenAI 首届开发者大会上全面更新了 GPT-4 模型,包括微调 API,新增函数调用 API,以及搜索增强 API。如今,来自美国加州实验室 FAR AI 的团队从这三大方向,对 GPT-4 API 开启「红队」攻击测试。没想到,GPT-4 竟能成功越狱。论文地址:https://arxiv.org/ abs / 2312.14302通过 15 个有害样本和 100 个良性样本进行微调,就完全能够让 GPT-4「放下戒备心」,生成有害的内容。比如,生成错误的公众人物信息,提取训练数据中电子邮件等私人信息,还会在代码建议中插入恶意的 URL。有网友警告,千万不要在 GPT-4 中输入任何你不想让别人看到的东西。研究人员还发现,GPT-4 As

关注公众号
标签: 漏洞