微比恩 > 信息聚合 > Facebook 开源数据增强库:可令 AI 精准识别盗版图文音视频

Facebook 开源数据增强库:可令 AI 精准识别盗版图文音视频

2021-07-18 14:41:36来源: IT之家

7 月 18 日消息,只要稍微动点手脚,就会给 AI 模型的鲁棒性带来挑战。在 AI 眼里,下面这两张图片可能毫无关联。不过,Facebook AI 在近日开源了用于数据增强的新 Python 库 ——AugLy。使用 AugLy 数据增强训练 AI 模型,训练后 AI 可以对用户上传的内容,进行更精确的识别,有助于识别盗版图文音视频。它支持音频、图像、视频和文本 4 种模态,提供了超过 100 种数据增强功能,可以对输入内容进行多种处理。比如,改变文字的大小写、字体、编码方式,给文本添加标点、调整字母位置、模拟错别字,以及裁剪、旋转图片,给图片加文字、增加饱和度、增加亮度、改变清晰度等。这一项目已经获得 1.8k 颗星,并且登上了 GitHub 热榜。让 AI 识别「截屏转发」AugLy 的目的是涵盖现实网络中具体的数据增强,用来创建样本,从而训练和测试模型。根据 Facebook 和 Instagram 等平台上的生活图像和

关注公众号