Craiyon 텍스트-이미지 생성기: 온라인 데모(이전 명칭 DALL·E Mini)
AI로 구동되는 텍스트 기반 이미지 생성 도구 Craiyon에 대해 궁금한 점이 있으신가요? 저희가 답해 드립니다. 이 글은 AI 번역본입니다. 오역이 의심되는 부분이 있으면 댓글로 자유롭게 알려 주세요.
Created on September 15|Last edited on September 15
Comment
직접 Craiyon 데모를 사용해 보세요!
아래 입력란에 원하는 텍스트 프롬프트(AI가 생성하길 원하는 내용)를 입력하고 “실행”을 눌러 주세요.
이 도구를 가지고 놀아 본 수백만 명의 사람들처럼, 우리도 이 머신러닝 모델이 보여 주는 성과에 감탄하지 않을 수 없습니다. Craiyon 개발자 Boris Dayma와의 인터뷰에서 Weights & Biases의 Lukas Biewald가 언급했듯이, “[이 프로그램은] 정말 마법처럼 느껴집니다.”
아래에서 그 인터뷰의 더 많은 내용을 소개합니다. 하지만 먼저:
목차
Craiyon이란 무엇인가요?Craiyon은 어떻게 작동하나요?Craiyon의 역사Craiyon은 누가 만들었나요?Craiyon이 작동하는 데 얼마나 걸리나요?Craiyon 활용 예시관련 읽을거리
이제 궁금하신 분들을 위해, 사람들이 Craiyon에 대해 자주 묻는 질문들을 살펴보겠습니다.
Craiyon이란 무엇인가요?
Craiyon은 텍스트로부터 이미지를 생성하는 AI 모델입니다. 사용자인 여러분이 보고 싶은 내용을 텍스트 프롬프트로 입력하면, Craiyon이 그에 맞춰 이미지를 만들어 냅니다. 이 모델은 더 가벼운 버전으로 개발되었으며 OpenAI의 DALL‑E에서 파생되었으며, 처음에는 DALL‑E Mini로 불렸습니다.
위에서 보셨듯이 Craiyon은 저희 웹사이트에서 사용할 수 있으며, 대부분의 사용자들이 그렇게 이용합니다. 또한 이는 GitHub에서 다운로드됨, 단순히 재미있는 밈과 이미지를 만드는 것 이상으로 활용하고 싶은 분들을 위해서입니다.
Craiyon은 어떻게 작동하나요?
Craiyon 모델은 처음에 인터넷에서 수집한 수백만 장의 이미지와 그에 첨부된 캡션으로 학습되었습니다. 이를 통해 단지 텍스트 프롬프트만으로도 이미지를 생성하도록 훈련될 수 있었습니다.
이 모델은 단순히 이미지를 재현하도록 만들어졌을 뿐만 아니라, 참조가 있는 어떤 프롬프트에도 개념들을 결합해 새로운 이미지를 생성할 수 있도록 학습되었습니다.
이 능력을 통해 다음과 같은 이미지를 만들어낼 수 있습니다:

이는 세 단계로 이루어집니다:
- 인코더는 텍스트 프롬프트를 숫자로 변환하며, 이 숫자는 해당 단어/문자열이 무엇인지를 나타냅니다. (예: 고슴도치, 응시하기)
- 그다음 모델은 이를 자신이 학습한 내용과 비교합니다. 이미지에서 고슴도치를 “본” 적이 있다면, 고슴도치는 어떤 숫자와 연관됩니다.
- 그다음 모델은 이러한 연관성을 바탕으로 이미지를 생성하며, 품질 필터를 통과한 뒤에야 여러분이 그 결과를 볼 수 있습니다.
Craiyon의 역사
AI 이미지 생성기는 처음에 Boris Dayma가 다음에서 제안했습니다 JAX/Flax 커뮤니티 위크, 2021년 6월에 Google Cloud와 협업으로 Hugging Face 포럼에서 진행된 일종의 경진대회였습니다. 초기 버전인 Craiyon, 즉 DALL·E Mini는 이 프로그램 기간 동안 Google Cloud가 제공한 단일 TPU v3‑8에서 단 3일간만 학습되었습니다. 이렇게 짧은 학습 ��간과 OpenAI의 DALL·E보다 27배나 작은 아키텍처에도 불구하고, 상당한 성과를 거두었습니다.
2022년 5월 말부터 6월 사이에 입소문을 타며 폭발적인 인기를 얻었고, 심지어 노 유어 밈. 이는 OpenAI의 프로젝트인 DALL‑E 사용자들 사이에 혼란을 초래한 것으로 보입니다 DALL‑E 2, 그리고 OpenAI의 요청으로 이름이 Craiyon으로 변경되었습니다.
Craiyon은 누가 만들었나요?
Craiyon은 2021년 6월 JAX/Flax 커뮤니티 위크에서 Boris Dayma가 개발했습니다. Boris는 텍사스 휴스턴을 기반으로 활동하는 머신러닝 엔지니어입니다. Craiyon 외에도 HuggingTweets와 같은 다른 머신러닝 프로젝트를 주도했습니다.
Craiyon이 작동하는 데 얼마나 걸리나요?
인터랙티브 웹 데모에서 Craiyon이 이미지를 생성하는 데는 약 2분 30초가 걸립니다. 로컬에서 Craiyon을 실행하는 경우 속도는 사용자의 컴퓨터 하드웨어에 따라 달라지며, Google Colab에서는 이미지를 생성하는 데 대략 1분 정도만 걸립니다.
Craiyon 활용 예시
Craiyon은 Z세대식 유머와 찰떡처럼 잘 맞기 때문에 이렇게 인기를 얻었습니다. 솔직히 말해, 더 정교한 모델들과 비교했을 때 가끔 비논리적이고 예측 불가능한 결과를 내는 점이 오히려 매력을 더합니다. Craiyon이 하는 일에는 뭔가 특별함이 있습니다. 인터넷이라는 발열의 꿈을 능숙하게 흉내 내는 능력이죠. 온라인 소통과 새로운 자극에 대한 채워지지 않는 갈망에 의해 오염된 인간 의식의 거의 궁극적인 표상입니다.
다음은 Craiyon이 만든 재미있는 이미지들입니다:

그리고 덜 웃기지만 여전히 멋진 이미지들도 있습니다:

자, 이제 무엇을 상상해 볼까요?
관련 읽을거리
DALL-E Mini Explained
Generate images from a text prompt in this interactive report: DALL-E Mini Explained, a reproduction of OpenAI DALL·E
The Infrastructure Behind Serving DALL·E Mini
In this article, we explore the technology underpinning Dall-E mini and set up a high-load backend infrastructure on Google TPUs.
Collaboration in ML made easy with W&B Teams
How to use W&B Teams on your teams next machine learning project
DALL·E Mega - Training Journal
Add a comment
