OpenAI通过DALL-E 3加强了其图像生成AI工具

OpenAI通过DALL-E 3加强了图像生成AI工具

OpenAI发布了其图像生成工具的下一代产品。被称为DALL-E 3的新版本旨在更好地理解您的文本描述,以创建更准确和忠实的图像。在DALL-E 3的新网页上,OpenAI并没有透露太多关于这个工具的信息,但提供了一些关于如何超越其前身DALL-E 2的提示。

DALL-E 3旨在更好地把握您描述的细微差别和细节,从而创建更准确的图像,OpenAI表示。现有的基于人工智能的图像生成器有时会忽略您描述中的词语,导致图像与预期相去甚远。根据DALL-E 3页面上显示的图像,新版本似乎能够创建更准确、详细和富有想象力的图像。

此外:2023年最佳AI图像生成器

随着人工智能的兴起,图像生成器在个人和企业中越来越受欢迎。像DALL-E 2、微软的Bing图像生成器、Midjourney、Stable Diffusion、DreamStudio和Craiyon等工具的工作原理都差不多。您通过提示描述您想要生成的图像,选择样式和其他属性。然后,该工具将创建一个或多个与您请求相匹配的图像。

但是,像今天的许多AI机器人一样,这些图像生成器使用起来可能会有一些挑战。通常情况下,您必须以恰当的方式表达提示。即使这样做了,它们也不总是能正确解释您的请求。鉴于现代文本到图像系统迫使您学习提示工程,OpenAI表示,DALL-E 3将在生成更符合您描述的图像方面取得一大进展。

DALL-E 3基于ChatGPT构建,将通过ChatGPT平台进行访问。这里的好处是您可以使用ChatGPT来构思图像的想法和提示。然后,您可以使用简单的句子或更详细的段落提出创建图像的请求。

此外:我最喜欢的两个ChatGPT Plus插件以及我可以使用它们做的令人惊叹的事情

在DALL-E 3网页上提供的示例中,OpenAI展示了新版本的工作方式。

一个图像是基于以下描述生成的:“戴着雄伟的王冠坐在宝座上的小土豆国王,饭统治着他们的广阔土豆王国,里面满是土豆臣民和土豆城堡。”

第二个图像是基于以下描述创建的:“插画中,一个坐在治疗师椅子上的鳄梨说着‘我只是感觉内心空虚’,中心有一个坑洞大小的孔。治疗师是一把勺子,正在写笔记。”

还有两张图像是基于以下描述生成的:“一个篮球运动员扣篮的表现性油画,被描绘成星云的爆炸。”其中一张图像使用了DALL-E 2,而另一张使用了DALL-E 3。

OpenAI还强调,它已经限制了DALL-E 3生成暴力、成人或令人讨厌的内容的能力,就像以前的版本一样。在公众人物的创作和某些有害偏见方面进行了安全改进。例如,该工具将拒绝要求按姓名询问公众人物的提示。

此外:AI生成的代码、图像和叙述由谁拥有?

当使用AI生成的图像来描绘真实的人物或事件时,可能会引发问题,误导人们认为该图像是真实的。为了解决这个问题,OpenAI表示正在测试一种新的内部工具,可以判断图像是否由DALL-E 3生成。

DALL-E 3目前正在进行封闭测试,计划于10月初向ChatGPT Plus和企业客户推出。