Craiyon文本图像生成器:在线演示(之前为 DALL-E Mini)
对于 Craiyon 这一由 AI 驱动的文本转图像生成工具还有些疑问吗?我们将在这里为您一一解答。
Created on August 15|Last edited on August 15
Comment
亲自尝试 Craiyon演示!
只需在下方输入一则文本提示(即:您想让 AI 系统创造的东西),然后点击“运行”即可。
和数以百万计的体验过这一工具的其他人一样,我们也不禁对该机器学习模型的能力感到惊叹。正如 Weights & Biases 的 Lukas Biewald 在一次与 Craiyon 开发者 Boris Dayma 共同接受的采访中提到的那样,“[这款程序]真的太梦幻了。”
您可在下方查看有关此次采访的更多信息。但是,首先还是看看以下内容吧:
目录
现在,如果您还是有些好奇的话,我们先来看看人们对于 Craiyon 的一些常见疑问吧:
Craiyon是什么?
Craiyon是一个根据文本生成图像的AI模型。用户只需输入一段文本提示(即描述一下您想看到什么),Craiyon就会相应地进行创作工作。其最初是作为一种简版的 OpenAI DALL-E 而进行研发的,那时的名称还是DALL-E Mini。
Craiyou的工作原理是什么?
最开始时,Craiyon模型的训练工作中用到了数以百万计的互联网图像和与之对应的简介。这些图像帮助模型学会了仅从文本提示进行图像创作的能力。
模型不仅能够重建图像,还被训练能够对概念进行组合以创造出全新的图像 - 只要其之前接触过给出的文本语句。
这样的技能就使之可以创作出这样的图像:

完成此操作需要进行三个步骤:
- 编码器将文本提示转换为数字,用数字来表示单词/字符串的内容(比如:“刺猬”或“凝视”)。
- 然后模型将这一信息与其所训练的内容进行对比。如果它在一张图像中“看到”过刺猬,那么就会把刺猬这一概念关联至数字。
- 接着模型会根据这些关联来生成图像,并在呈现给您之前再使用一个质量过滤器(quality filter)进行处理。
Craiyon的历史
这一AI图像生成器由Boris Dayma于2021年6月在Hugging Face论坛与Google Cloud合作举行的 JAX/Flax 社区周上首次提出。最初版本的Craiyon名为 DALL-E Mini。整个项目期间其只在由 Google Cloud 提供的单 TPUv3-8 机器上训练了 3 天。尽管训练时间非常短暂,且其架构比 OpenAI 的 DALL-E 要轻量27倍,但基本上来说这是训练是成功的。
在2022年5月下旬和6月,它实现了病毒化传播,甚至被收录进了Know Your Meme。这似乎让用户分不清其与 OpenAI 项目 DALL-E 和 DALL-E 2 之间的区别,所以OpenAI要求其更名为Craiyon。
是谁打造了 Craiyon?
Craiyon由Boris Dayma于2021年的 JAX/FLAX 社区周开发。Boris 是一位居住在美国得克萨斯州休斯顿的机器学习工程师。除了Craiyon 之外,他还负责其他的机器学习项目,如:HuggingTweets。
Craiyon需要多长时间运行?
Craiyon 通常需要两分半钟的时间来从互动式网页 Demo 中生成图像。对于运行于本地的 Craiyon 实例,其运行速度将根据计算机的硬件确定。在 Google Colab 中只需大约一分钟即可生成图像。
Craiyon使用示例
Craiyon非常适合用于创作Z时代的表情包,所以其才如此流行。老实说,与更复杂的同类工具相比,Craiyon 时有时无的不一致性和结果的不可预测性更增添了其魅力。不过 Craiyon 仍有一些特别之处,那就是能够模仿出人人都热衷追捧的网上生活。人类意识被在线交流和对新刺激永不满足的需求所毒害次末级别表现。
这里有一些使用 Craiyon 创建的搞笑图片:

以及一些不那么搞笑,但却更酷的图片:

现在,您还会梦想什么呢?
相关阅读
DALL-E Mini Explained
Generate images from a text prompt in this interactive report: DALL-E Mini Explained, a reproduction of OpenAI DALL·E
The Infrastructure Behind Serving DALL·E Mini
In this article, we explore the technology underpinning Dall-E mini and set up a high-load backend infrastructure on Google TPUs.
Collaboration in ML made easy with W&B Teams
How to use W&B Teams on your teams next machine learning project
DALL·E Mega - Training Journal
Add a comment
Tags: DALL-E, Computer Vision
Iterate on AI agents and models faster. Try Weights & Biases today.
