Dall-E,美国图像生成系统。
美国人工智能非营利组织OpenAI于2021年1月份推出Dall—E,这是一个可以根据书面文字生成图像的人工智能系统,该名称来源于著名画家达利(Dalí)和机器人总动员(Wall-E)。该系统可以根据简单的描述创建极其逼真和清晰的图像,精通各种艺术风格,包括插画和风景等。它还可以生成文字来制作建筑物上的标志,并分别制作同一场景的草图和全彩图像。
DALL-E:很强大,但仍有缺陷
和GPT-3一样,DALL-E也是一个Transformer语言模型。它同时接收文本和图像作为单一数据流,其中包含多达1280个token,并使用最大似然估计来进行训练,以一个接一个地生成所有的token。这个训练过程不仅允许DALL-E可以从头开始生成图像,而且还可以重新生成现有图像的任何矩形区域,与文本提示内容基本一致。