[图]OpenAI推DALL-E模型：可基于文字描述生成图片-AI人工智能-cnBeta.COM

机器学习公司OpenAI今天宣布了两个多模式人工智能系统DALL-E和CLIP。 DALL-E可以将计算机视觉和自然语言处理（NLP）结合起来，从文字描述中生成图片。例如，下面的照片是通过“戴着芭蕾舞短裙和walking狗的小胡萝卜的插图”生成的。

访问：

JD PLUS会员元旦促销：视频双重会员148元，送30元红包，不设门槛

阿里云“爆炸性特价”主题活动-云服务器低至0.55折96元/年

在今天由OpenAI进行的测试中，Dall-E能够操纵和重新排列所生成图像中的对象，并且还可以创建不存在的东西，例如豪猪的纹理或立方体。

OpenAI今天在有关DALL-E的网志中表示：“我们认识到涉及生成模型的工作可能会产生重大而广泛的社会影响。将来，我们计划分析DALL-E和社会等模型。问题之间的关系，例如对某些工作流程和职业的经济影响，模型输出中的潜在偏见以及由此带来的长期道德挑战技术。”

OpenAI今天还推出了CLIP，这是一种多模式模型，可以教育从互联网收集的4亿对图片和文本。 CLIP利用类似于GPT-2和GPT-3语言模型的零击学习功能。

在关于该模型的论文中，它写道：“我们发现CLIP与GPT系列相似。它可以学习在预训练中执行各种任务，包括OCR，地理位置和动作识别。有一个数据集可以对CLIP的零点换档性能进行基准测试，并且发现它可以与以前的特定任务监督模型竞争。”