图为人工智能系统 DALL·E根据文本“穿着芭蕾舞裙遛狗的小萝卜”绘制的图像 图片来源:OpenAI官网 自然语言处理与视觉处理,都重在对不同模态数据所包含的语义信息进行识别和理解,但是两种数据的语义表现形式和处理方法不同,导致存在所谓的“语义壁垒”,现在这种壁垒正在被AI打破。 ◎本报记者 马爱平 1月初,美国人工智能公司OpenAI推出两个跨越文本与图像次元的模型:DALL·E和CLIP,前者可以基于文本生成图像,后者则可以基于文本对图片进行分类。这个突破说明通过文字语言来操纵视觉概念现在已经触手可及。自然语言处理和视觉处理的边界已经被打破,多模态AI系统正在逐步建立。 “数据的来源或者形式是多种多样的,每一种都可以称为一种模态。例如图像、视频、声音、文字、红外、深度等都是不同模态的数据。单模态AI系统只能处理单个模态的数据。例如对于人脸识别系统或者语音识别系统来说,它们各自只能处理图像和声
把文本变成画作,AI对艺术“下手”了
2021-02-01 00:00:00来源: 人民网
关注公众号
赞
你的鼓励是对作者的最大支持
- 赵何娟:中国AI追随之路的五大误区,我们至少落后十年|钛媒体AGI2024-05-11 12:04:07
- 剪映即梦AI上手体验:想要「干翻」Sora,似乎还有点距离2024-05-11 12:28:40
- 解码AI驱动的未来,2024长江独角兽峰会在深圳圆满举行2024-05-11 13:34:25
- 更专注AI和半导体,甚至有意PK英伟达!软银出售部分“愿景基金”资产2024-05-11 13:09:51
- 十年磨一「图」,谷歌震撼发布纳米级人脑图谱!AI 加持人类大脑研究2024-05-10 20:20:46
- ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入2024-05-10 20:34:55
- 上财年赚了 5 万亿日元,丰田宣布向纯电动汽车、AI 等领域投资 1.7 万亿日元2024-05-10 23:16:12
- 全新 13 英寸苹果 iPad Air 亮度可达 600 尼特,比 11 英寸型号高 20%2024-05-10 23:23:55
- 华擎为英特尔锐炫 Arc 显卡推出 AI QuickSet 工具:轻松安装 Stable Diffusion,支持 Op…2024-05-10 23:31:30
- OpenAI 官宣 5 月 13 日直播演示 ChatGPT 更新内容2024-05-11 07:24:30
- 1东北“烧烤大王”转身:二次创业,成为烧烤“供应链大王”
- 2苹果创新不足的原因找到了
- 35月10日A股分析:创业板指跌1.15%,跌幅最多的行业板块为电池、半导体、医疗服务,两市合计成交9125.32亿元
- 4极氪5月10日在纽交所挂牌上市,宁德时代认购IPO
- 51分钟售罄5个亿额度,地方政府债券被抢疯了
- 6科技巨头们开始抢电?聊聊AI用电荒和核聚变创业热
- 7七工匠全画幅 AF 85mm F1.8 镜头、40mm E 卡口镜头新品亮相
- 8“夫妻店”,占领创业圈
- 9为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列
- 10因 4/5G 专利诉讼,联想、摩托罗拉支持蜂窝网络设备在德国遭遇全面禁售