微比恩 > 信息聚合 > 字节跳动最新文本生成图像 AI，训练集里居然没有一张带文字描述的图片？！

字节跳动最新文本生成图像 AI，训练集里居然没有一张带文字描述的图片？！

2022-03-23 21:36:35来源: IT之家

字节跳动最新文本生成图像 AI，训练集里居然没有一张带文字描述的图片？！

图片地址：https://img.ithome.com/newsuploadfiles/2022/3/a5f2538f-b006-41d3-8621-9f10c88ce3d4.jpg

一个文本-图像对数据都不用，也能让 AI 学会看文作图？来自字节的最新 text2image 模型，就做到了。实验数据显示，它的效果比 VQGAN-CLIP 要真实，尤其是泛化能力还比不少用大量文本-图像数据对训练出来的模型要好很多。嗯？不给文字注释 AI 怎么知道每一张图片代表什么？这个模型到底咋训练出来的？不用文字训练也能根据文本生成图像首先，之所以选择这样一种方式，作者表示，是因为收集大量带文字的图像数据集的成本太高了。而一旦摆脱对文本-图像对数据的需求，我们就可以直接用大型无文本图像数据集（比如 ImageNet）来训练强大且通用的 text2image 生成器。字节实现的这个模型叫做 CLIP-GEN，它具体是怎么操作的？一共分三大步。首先，对于一幅没有文本标签的图像，使用 CLIP 的图像编码器，在语言-视觉（language-vision）联合嵌入空间（embedding space）中提取图像的 em

关注公众号

标签：字节跳动 AI

提示：支持键盘“← →”键翻页

上一篇戴尔推出新款灵越 14 Pro 笔记本：搭载 12 代酷睿，5499 元起

下一篇《巫师》新作抛弃自家引擎改用虚幻 5，前 CDPR 员工：每次开发都推倒重来，换了更省事

赞

你的鼓励是对作者的最大支持

相关阅读

2024 ACCA-SNAI年度研讨会：为新质生产力注入财会动能2024-05-16 17:30:00
谷歌 2 小时复仇硬刚 GPT-4o：Gemini 颠覆搜索，视频 AI 对抗 Sora2024-05-16 13:24:48
Rapidus 携手 RISC-V 设计企业 Esperanto，开发低功耗数据中心 AI 芯片2024-05-16 14:09:33
含 AI 工具中的“满分”漏洞，英特尔发 41 份公告修复 90 个漏洞2024-05-16 14:42:29
魅族全新 Flyme AIOS 登场：支持一键 AI 搜索、AI 接听等2024-05-16 14:52:28
GPT-4o 再秀神操作，“复现”OpenAI 总裁讲课，网友当真了2024-05-16 14:56:58
599 元，魅族 LIVE AI 真无线 Hi-Fi 降噪耳机发布2024-05-16 15:31:33
乐道首车 L60 开启预售；字节跳动发布豆包大模型；微软中国AI团队整体打包赴美｜Do早报2024-05-16 08:54:47
【钛晨报】证监会：从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为；字节跳动自研大模型豆包宣布正式对外提供服务…2024-05-16 07:20:00
智氪 | AI锋芒初现，助腾讯业绩大超预期2024-05-15 18:09:46

热门排行榜

1日1周1月

免费发布分类信息

最新图片