텍스트에서 Craiyon 이미지 생성기: 온라인 데모(전 DALL-E Mini)
인공지능으로 구동되는 텍스트-이미지 생성 프로그램인 Craiyon에 대한 질문이 있으신가요? 그 질문에 대한 답을 드리겠습니다.
Created on August 15|Last edited on August 15
Comment
Craiyon 데모를 직접 사용해보세요!
아래에 (AI 시스템이 생성해주길 원하는) 텍스트 프롬프트를 입력하고 "실행(Run)"을 누르기만 하면 됩니다.
이 프로그램을 가지고 놀아봤던 수백만의 다른 사용자들처럼, 우리 역시 지금 이 머신 러닝 모델이 하는 일에 대해서 놀라지 않을 수 없을 것입니다. Weights & Bias의 루카스 비왈드(Lukas Biewald)가 Craiyon의 개발자인 보리스 데이마(Boris Dayma)와의 인터뷰에서 언급한 바와 같이, "[이 프로그램]은 정말 마법처럼 느껴집니다."
아래 인터뷰 내용에서 더 자세히 알아보세요. 하지만 먼저 다음을 살펴보세요:
목차
Craiyon(크레용)이란?Craiyon은 어떻게 작동할까요?Craiyon의 역사누가 Craiyon을 만들었나요?Craiyon이 작동하는데는 얼마나 걸리나요?작업 중인 Craiyon의 예시 관련 읽기 자료
이제 호기심 많은 분들을 위해 사람들이 Craiyon에 대해 가지고 있는 몇 가지 흔한 질문들에 대해서 살펴보도록 하겠습니다.
Craiyon(크레용)이란?
Craiyon은 텍스트에서 이미지를 생성해주는 AI 모델입니다. 사용자(여러분)가 (여러분이 보고자 하는) 텍스트 프롬프트를 입력하면 Craiyon이 이를 프롬프트를 생성해줍니다. 가벼운 버전의OpenAI의DALL-E로 개발되었으며, 처음에는 DALL-E Mini라는 이름으로 불렸습니다.
위에서 보셨듯이, Craiyon은 저희 웹사이트를 통해 사용하실 수 있고, 많은 사람들이 이미 사용하고 있습니다. 또한 Github에서 다운로드할 수도 있습니다. 단순히 재미있는 밈(meme)들과 이미지를 창조하는 것 이상을 하고 싶은 사람들을 위해서 말이죠.
Craiyon은 어떻게 작동할까요?
Craiyon 모델은 처음에 인터넷에서 가져온 수백만 개의 이미지들과 함께 제공되는 캡션들에 대한 트레이닝을 받았습니다. 이를 통해 텍스트 프롬프트에서 이미지를 생성하도록 트레이닝 할 수 있었습니다. 모델은 이미지를 재현할 수 있도록 만들어졌을 뿐만 아니라 참조할 수 있는 모든 프롬프트에서 새로운 이미지를 만들기 위해 개념을 결합하도록 트레이닝 받기도 했습니다.
이 기술을 통해 다음과 같은 이미지를 만들 수 있습니다.

이 작업은 다음 세 단계로 수행됩니다.
- 인코더가 텍스트 프롬프트를 단어/문자열이 무엇(예: 고슴도치)인지를 나타내는 숫자로 바꿉니다.
- 이후에 모델은 이 숫자를 트레이닝 받은 내용과 비교합니다. 이미지에서 고슴도치가 "보인"다면, 고슴도치는 숫자와 연결됩니다.
- 그런 다음 모델이 이러한 연결에서 이미지를 생성하면 품질 필터를 통과한 후에 여러분에게 이미지가 나타납니다.
Craiyon의 역사
AI 이미지 생성기는 2021년 6월 구글 클라우드와 협력하여 Hugging Face 포럼에서 열린 일종의 경연대회인JAX/Flax 커뮤니티 위크에서 보리스 데이마(Boris Dayma)가 처음 제안했습니다. DALL·E Mini라고 불리는 초기 버전 Craiyon은 프로그램 중에 구글 클라우드가 제공하는 단일 TPUv3-8로 3일 동안만 트레이닝 하였습니다. 짧은 트레이닝 시간과OpenAI의 DALL·E보다 27배 더 작은 아키텍처에도 불구하고 큰 성공을 이루어냈습니다.
2022년 5월 말과 6월에 입소문을 타면서 웹사이트인 Know Your Meme(KYM)에도 이름을 올렸습니다. 이로 인해 DALL-E에서 DALL-E 2오픈 사용자들 사이에 혼선이 생기게 되어, OpenAI의 요청에 따라 Craiyon으로 이름이 변경되었습니다.
누가 Craiyon을 만들었나요?
Craiyon은 2021년 6월에 JAX/FLAX 커뮤니티 위크에서 보리스 데이마가 개발했습니다. 보리스는 텍사스 휴스턴에 기반을 둔 머신 러닝 엔지니어입니다. 보리스는 Craiyon 외에도, HuggingTweets 같은 다른 머신 러닝 프로젝트를 담당하고 있습니다.
Craiyon이 작동하는데는 얼마나 걸리나요?
Craiyon이 대화형 웹 데모(Interactive web demo)에서 이미지를 생성하는 데는 약 2분 30초가 걸립니다. Craiyon의 로컬 실행 사례의 경우 속도는 컴퓨터 하드웨어에 따라 다르며 구글 코랩(Colab)에서는 이미지를 생성하는 데 약 1분밖에 걸리지 않습니다.
작업 중인 Craiyon의 예시
Craiyon은 줌머 유머(Zoomer humor)의 장갑처럼, 딱 맞아떨어져서 인기가 많아졌습니다. 솔직히 말하자면, 더 정교한 경쟁자와 비교해보면 때로는 일관성이 없고 예측할 수 없는 결과가 매력을 더해줍니다. Craiyon에는 특별한 점이 있습니다. 바로 인터넷에서의 삶인 악몽을 모방하는 능력입니다. 온라인 커뮤니케이션에 중독된 인간의 의식과 새로운 자극에 대한 끝없는 욕구를 말이죠.
다음은 Craiyon이 생성한 재미있는 몇 개의 사진들입니다:

재미는 없어도 여전히 멋진 사진들도 있습니다.

이제, 여러분이 꿈꿀 수 있는 것은 무엇일까요?
관련 읽기 자료
DALL-E Mini Explained
Generate images from a text prompt in this interactive report: DALL-E Mini Explained, a reproduction of OpenAI DALL·E
The Infrastructure Behind Serving DALL·E Mini
In this article, we explore the technology underpinning Dall-E mini and set up a high-load backend infrastructure on Google TPUs.
Collaboration in ML made easy with W&B Teams
How to use W&B Teams on your teams next machine learning project
DALL·E Mega - Training Journal
Add a comment
Tags: DALL-E, Computer Vision
Iterate on AI agents and models faster. Try Weights & Biases today.