微比恩 > 信息聚合 > 开源训练集 LAION-5B 遭曝内含“儿童性虐待内容”，Stable AI“紧急撇清关系”

开源训练集 LAION-5B 遭曝内含“儿童性虐待内容”，Stable AI“紧急撇清关系”

2023-12-21 15:58:11来源: IT之家

开源训练集 LAION-5B 遭曝内含“儿童性虐待内容”，Stable AI“紧急撇清关系”

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/ebca97fe-d245-4f4c-8ba9-7e116be02762.jpg?x-bce-process=image/watermark,image_aW1nL3dhdGVybWFyay9xYy9xYzgwLnBuZw==,t_100,g_9,y_18,x_18,a_0/format,f_auto

IT之家 12 月 21 日消息，据彭博社报道，斯坦福大学近日针对开源模型训练数据集 LAION-5B 展开研究，发现该数据集中存在 3000 项“可疑的儿童性虐待内容”，之后 LAION 项目维护人员紧急下架了 LAION-5B，并声称已经移除了 1008 项“确凿的相关内容”。▲ 图源彭博社（下同）外媒表示，LAION-5B 训练集总共拥有 58.5 亿项图片信息，Stability AI 曾利用 LAION 数据集来训练自家 AI 模型，从而为用户提供“文生图服务”。不过IT之家注意到，Stability AI 迅速向外媒回应，“Stable Diffusion 模型虽然使用 LAION-5B 进行训练，但采用的是‘经过筛选及微调过的’训练集版本，因此‘并不会影响模型输出结果’”。斯坦福大学声称，从 LAION-5B 事件可以看出业界“应当还有大量数据集存在有相关不当内容”，研究人员呼吁模型训练方应当谨慎甄选“必要的训练

关注公众号

标签：开源

提示：支持键盘“← →”键翻页

上一篇长征七号遥八运载火箭安全运抵文昌，预计下月发射天舟七号

下一篇丰田全资子公司大发安全测试造假，全面停售 64 款受影响车型

赞

你的鼓励是对作者的最大支持

相关阅读

类 Unix 开源操作系统 NetBSD 禁止提交由 AI 生成的代码2024-05-17 16:27:14
腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用2024-05-14 17:01:24
给文字动画注入语义灵魂！港科大开源「文字跳动」技术，每个单词都浪漫2024-05-13 18:09:54
“为世界工业软件提供第二选择”：OGG 1.0 正式发布，华为牵头贡献开源代码2024-05-11 14:39:44
Bungie 经典 FPS 游戏《马拉松》开源社区免费版上线 Steam，原作 1994 年发行2024-05-11 07:40:36
阿里云发布通义千问2.5，中文性能全面赶超GPT-4 Turbo，千问110B成为全球最强开源大模型2024-05-09 23:09:43
阿里云发布通义千问2.5，赶超GPT-4，千问110B成为全球最强开源大模型2024-05-09 23:09:43
完全采用纯国产软硬件构建，华中科技大学开源镜像站开放访问2024-05-09 11:41:00
开源编程语言 R 曝光存在 8.8 分代码执行漏洞 CVE-2024-27322，可引发供应链攻击2024-05-04 14:37:16
最高资助 1000 万元，深圳市宣布扶持重大开源项目商业发行版软件及芯片模组2024-04-29 20:39:47

热门排行榜

1日1周1月

免费发布分类信息

最新图片