Craiyonテキストからの画像生成ツール :オンラインデモ(旧DALL-E Mini)
AI搭載のテキストツーイメージ生成ツールCraiyonについでの質問はありませんか?それらの質問にお答えします。
Created on August 15|Last edited on August 15
Comment
Craiyonデモを試そう!
以下のテキストプロンプト(AIシステムで作成したいもの)を入力して、「Run」を押してください。
このツールを使って遊んだ何百万人もの人たちと同じように、私たちもこの機械学習モデルの質に感心しました。 Weights & BiasesのLukas Biewaldは、Craiyonの開発者Boris Dayma氏とのインタビューで「(このプログラムは)本当に魔法のように感じる」と述べています。
そのインタビュー内容の詳細は後ほど紹介しますが、まずはこちらをご覧ください:
目次
それでは、興味を持ってくださった方々のために、Craiyonに関するよくある質問をいくつか見てみましょう:
Craiyonとは?
Craiyonとは、テキストから画像を生成するAIモデルです。ユーザー(あなた)がテキストプロンプト(表示したいもの)を入力すると、Craiyonが画像を作成します。 Craiyonは、OpenAIのDALL-Eのより軽量なバージョンとして開発され、当初はDALL-E Miniという名称でありました。
先ほどご覧になったように、Craiyonは当社のウェブサイトから使用することができ、ほとんどの人がそのように使用しています。面白いミームや画像を作成するだけではなく、さらに多くのことをしたいと思っている方は、CraiyonをGithubからダウンロードすることもできます。
Craiyonの仕組み
Craiyonモデルは、当初、インターネット上の何百万もの画像とそれに付随するキャプションでトレーニングされました。これにより、テキストプロンプトだけで画像を作成できるようになりました。
ただし、モデルは画像を再現できるように作成されただけでなく、コンセプトを組み合わせて、参照するプロンプトから新しい画像を作成するように訓練されました。
このスキルにより、次のような画像を作成できます:

次の3つのステップでこれが達成されます:
- エンコーダがテキストプロンプトを数値に変換します。数値は、単語/文字列を表します。(例:「ハリネズミ」または「見つめている」)
- モデルはこれを訓練されたものと比較します。 画像内でハリネズミが「見られる」場合、そのハリネズミは数字で関連付けられます。
- その後、モデルはこれらの関連付けから画像を生成し、品質フィルタを通過した後に表示します。
Craiyonの歴史
AI画像生成ツールは、2021年6月にGoogle Cloudと共同でHugging Faceフォーラムで行われる様々な種類のコンペティション Jax/FlaxコミュニティウィークでBoris Dayma氏によって最初に提案されました。 DALL·E Miniと呼ばれるCraiyonの初期バージョンは、プログラム中にGoogle Cloudが提供する単一のTPUv 3-8で3日間のみトレーニングされました。これは、短いトレーニング時間とOpenAIのDALL・Eよりも27倍小さいアーキテクチャにもかかわらず、おおむね成功を収めました。
2022年5月下旬と6月には多くの注目を集め、Know Your Memeに掲載されるほどまでになりました。 これにより、OpenAIプロジェクトDALL-EとDALL-E 2のユーザー間で混乱が生じました。そこで、OpenAIの要請により、名称がCraiyonに変更されることになりました。
Craiyonの開発者は?
Craiyonは、2021年6月のJAX/FLAXコミュニティウィークでBoris Dayma氏によって開発されました。 Boris Dayma氏は、テキサス州ヒューストンに拠点を置く機械学習エンジニアです。Craiyonの他に、HuggingTweetsなどの他の機械学習プロジェクトを担当しています。
Craiyonが起動するまでどのくらいかかりますか?
インタラクティブなWebデモから画像を生成するのに約2分半かかります。Craiyonのローカルで実行されるインスタンスの場合、速度はコンピューターのハードウェアによって異なり、Google Colabでは画像を生成するのに1分程度で済みます。
実践でのCraiyonの例
Craiyonは、Z世代のユーモアとフィットし、人気を博しています。正直なところ、より洗練されたAI画像生成ツールと比較すると、Craiyonは時として一貫性がなく、予測不可能な結果を出しており、これが魅力となっています。Craiyonには特別な点があります。それは、インターネット上のファンタジーを模倣する能力であり、オンラインコミュニケーションと新たな刺激を求める人々の意識の第二の表現です。
それでは、Craiyonによって生成された面白い画像をいくつか紹介します。

一部の画像は、それほど面白くはありませんが、それでもユニークです:

では、何を考えられるでしょうか?
関連記事
DALL-E Mini Explained
Generate images from a text prompt in this interactive report: DALL-E Mini Explained, a reproduction of OpenAI DALL·E
The Infrastructure Behind Serving DALL·E Mini
In this article, we explore the technology underpinning Dall-E mini and set up a high-load backend infrastructure on Google TPUs.
Collaboration in ML made easy with W&B Teams
How to use W&B Teams on your teams next machine learning project
DALL·E Mega - Training Journal
Add a comment
Tags: DALL-E, Computer Vision
Iterate on AI agents and models faster. Try Weights & Biases today.