[图]OpenAI推DALL-E模型:可基于文字描述生成图片-AI人工智能-cnBeta.COM

机器学习公司OpenAI今天宣布了两个多模式人工智能系统DALL-E和CLIP。 DALL-E可以将计算机视觉和自然语言处理(NLP)结合起来,从文字描述中生成图片。 例如,下面的照片是通过“戴着芭蕾舞短裙和walking狗的小胡萝卜的插图”生成的。

访问:

JD PLUS会员元旦促销:视频双重会员148元,送30元红包,不设门槛

阿里云“爆炸性特价”主题活动-云服务器低至0.55折96元/年

1609870756329.webp

在今天由OpenAI进行的测试中,Dall-E能够操纵和重新排列所生成图像中的对象,并且还可以创建不存在的东西,例如豪猪的纹理或立方体。

OpenAI今天在有关DALL-E的网志中表示:“我们认识到涉及生成模型的工作可能会产生重大而广泛的社会影响。 将来,我们计划分析DALL-E和社会等模型。问题之间的关系,例如对某些工作流程和职业的经济影响,模型输出中的潜在偏见以及由此带来的长期道德挑战技术。”

9lmobdmx.jpg

OpenAI今天还推出了CLIP,这是一种多模式模型,可以教育从互联网收集的4亿对图片和文本。 CLIP利用类似于GPT-2和GPT-3语言模型的零击学习功能。

565.jpg

在关于该模型的论文中,它写道:“我们发现CLIP与GPT系列相似。 它可以学习在预训练中执行各种任务,包括OCR,地理位置和动作识别。 有一个数据集可以对CLIP的零点换档性能进行基准测试,并且发现它可以与以前的特定任务监督模型竞争。”

Source