IT之家 12 月 21 日消息,据彭博社报道,斯坦福大学近日针对开源模型训练数据集 LAION-5B 展开研究,发现该数据集中存在 3000 项“可疑的儿童性虐待内容”,之后 LAION 项目维护人员紧急下架了 LAION-5B,并声称已经移除了 1008 项“确凿的相关内容”。▲ 图源 彭博社(下同)外媒表示,LAION-5B 训练集总共拥有 58.5 亿项图片信息,Stability AI 曾利用 LAION 数据集来训练自家 AI 模型,从而为用户提供“文生图服务”。不过IT之家注意到,Stability AI 迅速向外媒回应,“Stable Diffusion 模型虽然使用 LAION-5B 进行训练,但采用的是‘经过筛选及微调过的’训练集版本,因此‘并不会影响模型输出结果’”。斯坦福大学声称,从 LAION-5B 事件可以看出业界“应当还有大量数据集存在有相关不当内容”,研究人员呼吁模型训练方应当谨慎甄选“必要的训练
开源训练集 LAION-5B 遭曝内含“儿童性虐待内容”,Stable AI“紧急撇清关系”
2023-12-21 15:58:11来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Bungie 经典 FPS 游戏《马拉松》开源社区免费版上线 Steam,原作 1994 年发行2024-05-11 07:40:36
- 阿里云发布通义千问2.5,中文性能全面赶超GPT-4 Turbo,千问110B成为全球最强开源大模型2024-05-09 23:09:43
- 阿里云发布通义千问2.5,赶超GPT-4,千问110B成为全球最强开源大模型2024-05-09 23:09:43
- 完全采用纯国产软硬件构建,华中科技大学开源镜像站开放访问2024-05-09 11:41:00
- 开源编程语言 R 曝光存在 8.8 分代码执行漏洞 CVE-2024-27322,可引发供应链攻击2024-05-04 14:37:16
- 最高资助 1000 万元,深圳市宣布扶持重大开源项目商业发行版软件及芯片模组2024-04-29 20:39:47
- OS / 2 Museum 开发者盛赞微软开源 MS-DOS 4,但指出开源方式存在不足2024-04-28 07:31:50
- 十字路口的苹果:终将走向“开源”?2024-04-27 21:42:51
- 阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型,与 Meta Llama3-70B 相媲美2024-04-27 20:38:56
- 苹果连放4个开源“小模型”,跑分却不到微软Phi-3一半,不卷性能卷效率?2024-04-25 19:31:34
- 1每天可处理 5600 吨原油,亚洲首艘圆筒型浮式生产储卸油装置“海葵一号”将服役我国首个深水油田
- 2七工匠全画幅 AF 85mm F1.8 镜头、40mm E 卡口镜头新品亮相
- 3欧洲小国想做锂电一哥:匈牙利缘何成中企投资热土
- 4支付宝花呗额度已可在微信、京东、抖音平台付款,需绑定南京银行账户
- 5因 4/5G 专利诉讼,联想、摩托罗拉支持蜂窝网络设备在德国遭遇全面禁售
- 6更专注AI和半导体,甚至有意PK英伟达!软银出售部分“愿景基金”资产
- 7华为云创业全球化加速营第二期开营
- 8iPhone AI 大升级:消息称苹果即将与 OpenAI 达成协议,iOS 18 用上 ChatGPT
- 9上海浦东启动“上市公司高质量发展服务月” 将支持上市公司再融资、并购重组
- 10全新极氪 001 车型 4 月销量 11729 台,获 25 万以上纯电冠军