微比恩 > 信息聚合 > Meta 推出 Purple Llama 检测套件,可评估 AI 模型安全水准

Meta 推出 Purple Llama 检测套件,可评估 AI 模型安全水准

2023-12-08 18:07:26来源: IT之家

IT之家 12 月 8 日消息,据 Meta 官方新闻稿,Meta 昨日推出一款名为 Purple Llama 的 AI 检测套件,号称提供了一系列工具,可帮助开发者检测自家 AI 安全性,并“负责任地部署生成式 AI 模型与应用程序”。IT之家获悉,Purple Llama 套件目前提供“CyberSec Eval”评估工具、Llama Guard“输入输出安全分类器”,Meta 声称,之后会有更多的工具加入这一套件。Meta 介绍称,Purple Llama 套件旨在规范自家 Llama 语言模型,也能够作用于其它友商的 AI 模型,这一套件的名称由来,是基于安全领域的“紫队概念”。Meta 声称,紫队是“攻击红队和防御蓝队”的结合,而 Purple Llama 套件的作用,就是在评估和缓解 AI 模型的潜在威胁,“兼顾攻击和防御策略”。▲ 图源 Meta具体而言,Purpl

关注公众号
标签: 安全 AI Meta