Skip to main content

텍스트에서 Craiyon 이미지 생성기: 온라인 데모(전 DALL-E Mini)

인공지능으로 구동되는 텍스트-이미지 생성 프로그램인 Craiyon에 대한 질문이 있으신가요? 그 질문에 대한 답을 드리겠습니다.
Created on August 15|Last edited on August 15
이는 여기에서 볼 수 있는 영어 기사를 번역한 것이다.



Craiyon 데모를 직접 사용해보세요!

아래에 (AI 시스템이 생성해주길 원하는) 텍스트 프롬프트를 입력하고 "실행(Run)"을 누르기만 하면 됩니다.
We're saving prompts so we can share how people interact with this model in the near future.


이 프로그램을 가지고 놀아봤던 수백만의 다른 사용자들처럼, 우리 역시 지금 이 머신 러닝 모델이 하는 일에 대해서 놀라지 않을 수 없을 것입니다. Weights & Bias의 루카스 비왈드(Lukas Biewald)가 Craiyon의 개발자인 보리스 데이마(Boris Dayma)와의 인터뷰에서 언급한 바와 같이, "[이 프로그램]은 정말 마법처럼 느껴집니다."
아래 인터뷰 내용에서 더 자세히 알아보세요. 하지만 먼저 다음을 살펴보세요:

목차



이제 호기심 많은 분들을 위해 사람들이 Craiyon에 대해 가지고 있는 몇 가지 흔한 질문들에 대해서 살펴보도록 하겠습니다.

Craiyon(크레용)이란?

Craiyon은 텍스트에서 이미지를 생성해주는 AI 모델입니다. 사용자(여러분)가 (여러분이 보고자 하는) 텍스트 프롬프트를 입력하면 Craiyon이 이를 프롬프트를 생성해줍니다. 가벼운 버전의OpenAI의DALL-E로 개발되었으며, 처음에는 DALL-E Mini라는 이름으로 불렸습니다.
위에서 보셨듯이, Craiyon은 저희 웹사이트를 통해 사용하실 수 있고, 많은 사람들이 이미 사용하고 있습니다. 또한 Github에서 다운로드할 수도 있습니다. 단순히 재미있는 밈(meme)들과 이미지를 창조하는 것 이상을 하고 싶은 사람들을 위해서 말이죠.

Craiyon은 어떻게 작동할까요?

Craiyon 모델은 처음에 인터넷에서 가져온 수백만 개의 이미지들과 함께 제공되는 캡션들에 대한 트레이닝을 받았습니다. 이를 통해 텍스트 프롬프트에서 이미지를 생성하도록 트레이닝 할 수 있었습니다. 모델은 이미지를 재현할 수 있도록 만들어졌을 뿐만 아니라 참조할 수 있는 모든 프롬프트에서 새로운 이미지를 만들기 위해 개념을 결합하도록 트레이닝 받기도 했습니다.
이 기술을 통해 다음과 같은 이미지를 만들 수 있습니다.

이 작업은 다음 세 단계로 수행됩니다.
  1. 인코더가 텍스트 프롬프트를 단어/문자열이 무엇(예: 고슴도치)인지를 나타내는 숫자로 바꿉니다.
  2. 이후에 모델은 이 숫자를 트레이닝 받은 내용과 비교합니다. 이미지에서 고슴도치가 "보인"다면, 고슴도치는 숫자와 연결됩니다.
  3. 그런 다음 모델이 이러한 연결에서 이미지를 생성하면 품질 필터를 통과한 후에 여러분에게 이미지가 나타납니다.

Craiyon의 역사

AI 이미지 생성기는 2021년 6월 구글 클라우드와 협력하여 Hugging Face 포럼에서 열린 일종의 경연대회인JAX/Flax 커뮤니티 위크에서 보리스 데이마(Boris Dayma)가 처음 제안했습니다. DALL·E Mini라고 불리는 초기 버전 Craiyon은 프로그램 중에 구글 클라우드가 제공하는 단일 TPUv3-8로 3일 동안만 트레이닝 하였습니다. 짧은 트레이닝 시간과OpenAI의 DALL·E보다 27배 더 작은 아키텍처에도 불구하고 큰 성공을 이루어냈습니다.
2022년 5월 말과 6월에 입소문을 타면서 웹사이트인 Know Your Meme(KYM)에도 이름을 올렸습니다. 이로 인해 DALL-E에서 DALL-E 2오픈 사용자들 사이에 혼선이 생기게 되어, OpenAI의 요청에 따라 Craiyon으로 이름이 변경되었습니다.

누가 Craiyon을 만들었나요?

Craiyon은 2021년 6월에 JAX/FLAX 커뮤니티 위크에서 보리스 데이마가 개발했습니다. 보리스는 텍사스 휴스턴에 기반을 둔 머신 러닝 엔지니어입니다. 보리스는 Craiyon 외에도, HuggingTweets 같은 다른 머신 러닝 프로젝트를 담당하고 있습니다.

Craiyon이 작동하는데는 얼마나 걸리나요?

Craiyon이 대화형 웹 데모(Interactive web demo)에서 이미지를 생성하는 데는 약 2분 30초가 걸립니다. Craiyon의 로컬 실행 사례의 경우 속도는 컴퓨터 하드웨어에 따라 다르며 구글 코랩(Colab)에서는 이미지를 생성하는 데 약 1분밖에 걸리지 않습니다.

작업 중인 Craiyon의 예시

Craiyon은 줌머 유머(Zoomer humor)의 장갑처럼, 딱 맞아떨어져서 인기가 많아졌습니다. 솔직히 말하자면, 더 정교한 경쟁자와 비교해보면 때로는 일관성이 없고 예측할 수 없는 결과가 매력을 더해줍니다. Craiyon에는 특별한 점이 있습니다. 바로 인터넷에서의 삶인 악몽을 모방하는 능력입니다. 온라인 커뮤니케이션에 중독된 인간의 의식과 새로운 자극에 대한 끝없는 욕구를 말이죠.
다음은 Craiyon이 생성한 재미있는 몇 개의 사진들입니다:

재미는 없어도 여전히 멋진 사진들도 있습니다.

이제, 여러분이 꿈꿀 수 있는 것은 무엇일까요?
여기��� 클릭해서 위로 스크롤한 후 Craiyon을 직접 사용해 보세요.

관련 읽기 자료


Iterate on AI agents and models faster. Try Weights & Biases today.