OpenAI：如果不使用版权内容，ChatGPT 等 AI 模型不可能开发出来-微比恩

图片地址：https://img.ithome.com/newsuploadfiles/2024/1/d2371c0c-16d7-4cde-b6dc-bbf9a28e6e95.jpg?x-bce-process=image/format,f_auto

IT之家 1 月 10 日消息，ChatGPT 开发商 OpenAI 近日承认，像 ChatGPT 这样的 AI 工具的开发离不开受版权保护的素材，并称如果没有这些素材，这些工具根本无法诞生。据《每日电讯报》报道，OpenAI 在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。ChatGPT 和图像生成器 DALL-E 等 AI 模型之所以拥有强大的能力，主要是因为它们通过海量的内容进行训练，其中一部分是从网上公开内容抓取而来，并不总是经过版权持有人的许可（OpenAI 确实会获得部分训练内容的许可）。这种“自由奔放”的抓取方式在学术机器学习研究中由来已久，但随着深度学习 AI 模型近期走向商业化，这种做法也受到了愈加严厉的审查。OpenAI 在提交给上议院的文件中写道，“由于当前版权涵盖了几乎所有形式的人类表达方式，包括博客文章、照片、论坛帖子、软件代码片段和政府文件，如果不使用受版权保护的