DALL·E mini - 텍스트 프롬프트에서 이미지 생성하기
DALL·E mini는 어떤 프롬프트에서든 이미지를 생성할 수 있는 AI 모델입니다!
Created on June 21|Last edited on June 25
Comment
DALL·E mini는 어떤 프롬프트에서든 이미지를 생성할 수 있는 AI 모델입니다!
어떻게 사용할까요?
서 저희 앱으로 여러분 만의 이미지를 생성할 수 있습니다.
어떻게 작동할까요?
역사
DALL·E mini는 오픈 소스 모델로 이러한 결과를 재현하려는 시도입니다.
간단한 설명
모델은 인터넷에서 수백만 개의 이미지를 관련 캡션과 함께 보면서 학습됩니다. 시간이 지남에 따라 텍스트 프롬프트에서 이미지를 그리는 방법을 학습합니다.
일부 개념은 유사한 이미지를 보았을 수 있기 때문에 메모리에서 학습됩니다. 그렇지만 또한 여러 가지 개념을 결합함으로써 "에펠탑이 달에 착륙하고 있다"와 같은 존재하지 않는 독특한 이미지를 만드는 방법도 배울 수 있습니다.
다음과 같은 결과를 얻기 위해 여러 모델들이 함께 합쳐집니다:
- 원본 이미지를 관련 디코더와 함께 일련의 숫자로 변환하는 이미지 인코더
- 텍스트 프롬프트를 인코딩 된 이미지로 변환하는 모델
- 더 나은 필터링을 위해 생성된 이미지의 품질을 판단하는 모델
기술적 설명
DALL·E mega가 무엇이냐고요?
DALL·E mega는 트레이닝을 받은DALL·E mini의 가장 큰 버전이며 다음과 같은 몇 가지 개선 사항이 포함되어 있습니다:
- DeepNet, Swin v2, NormFormer, Sandwich-LN, 그리고 GeLU/Swish/SmeLU와 함께하는 RMSNorm을 포함한 변환기 변형을 비교한 후 NormFormer 및 GLU 변형을 기반으로 한 새로운 설계도입니다.
이 모델은 아직 트레이닝 중입니다.
이 모델은 현재 사용 가능한가요?
네!
모델이 아직 트레이닝 중인 건 맞으나 최신 버전이 정기적으로 다음과 같이 제공됩니다:
또한, 다음을 사용하여 프로그래밍 방식으로 다운로드 하실 수도 있습니다:
import wandbrun = wandb.init()artifact = run.use_artifact('dalle-mini/dalle-mini/mega-1:latest')artifact_dir = artifact.download()
최신 모델의 결과
리소스
감사합니다
- Patrick von Platen과 Suraj Patil의 훌륭한 편성과 지원을 통해🤗 Hugging Face에서 주간 커뮤니티 (FLAX/JAX community week)를 조직해주었습니다.
- DALL·E mini 원작 저자: Boris Dayma, Suraj Patil, Pedro Cuenca, Khalid Saifullah, Tanishq Abraham, Phúc Lê Khắc, Luke Melas, Ritobrata Ghosh
- Rohan Anil, Phil Wang, Katherine Crowson과Gradio 팀, LAION & EleutherAI팀으로부터 기여와 지원을 받았습니다.
관련 게시물
Generating Digital Painting Lighting Effects via RGB-space Geometry
Exploring the paper "Generating Digital Painting Lighting Effects via RGB-space Geometry" in which the authors propose an image processing algorithm to generate digital painting lighting effects from a single image.
Deep Learning on the M1 Pro with Apple Silicon
Let's take my new Macbook Pro for a spin and see how well it performs, shall we?
Using OpenAI's GPT-3 to Generate 'Doctor Who' Episode Synopses
You can now track your GPT-3 fine-tunes with Weights & Biases! Here's how to do just that, but with more David Tennant than you were otherwise expecting
The Infrastructure Behind Serving DALL·E Mini
In this article, we explore the technology underpinning Dall-E mini and set up a high-load backend infrastructure on Google TPUs.
Add a comment
Iterate on AI agents and models faster. Try Weights & Biases today.