把文本变成画作，AI对艺术“下手”了-微比恩

图片地址：/mediafile/pic/20210201/3/14663297669321710367.jpg

　　图为人工智能系统 DALL·E根据文本“穿着芭蕾舞裙遛狗的小萝卜”绘制的图像　　图片来源：OpenAI官网　　自然语言处理与视觉处理，都重在对不同模态数据所包含的语义信息进行识别和理解，但是两种数据的语义表现形式和处理方法不同，导致存在所谓的“语义壁垒”，现在这种壁垒正在被AI打破。　　◎本报记者马爱平　　1月初，美国人工智能公司OpenAI推出两个跨越文本与图像次元的模型：DALL·E和CLIP，前者可以基于文本生成图像，后者则可以基于文本对图片进行分类。这个突破说明通过文字语言来操纵视觉概念现在已经触手可及。自然语言处理和视觉处理的边界已经被打破，多模态AI系统正在逐步建立。　　“数据的来源或者形式是多种多样的，每一种都可以称为一种模态。例如图像、视频、声音、文字、红外、深度等都是不同模态的数据。单模态AI系统只能处理单个模态的数据。例如对于人脸识别系统或者语音识别系统来说，它们各自只能处理图像和声