BLOOM: 공개 사용을 위한 1760억 매개변수 다국어 언어 모델 준비 완료
오랫동안 기다려온 BLOOM이 학습을 마치고 이제 대중이 사용하고 다운로드할 수 있게 되었습니다. 이 새로운 모델은 현재까지 공개된 것 중 가장 큰 다국어 언어 처리 모델입니다. 이 글은 AI 번역본입니다. 오역이 의심되는 부분이 있으면 댓글로 알려주세요.
Created on September 15|Last edited on September 15
Comment
117일에 걸친 최종 학습이 7월 6일에 완료되면서, 모델의 학습이 끝났고 최종 체크포인트의 공개 배포 준비가 완료되었습니다. 오늘 BigScience는 대화형 데모를 포함한 모든 자료를 공개했으며, 다음을 통해 자유롭게 접근할 수 있습니다. Hugging Face.
BLOOM이란 무엇인가요?
BLOOM은 1,750억 개의 파라미터를 가진 언어 처리 모델로, GPT-3와 OPT-175B처럼 텍스트를 생성할 수 있습니다. 이 모델은 다국어 지원을 목표로 개발되었으며, 46개의 자연어와 13개의 프로그래밍 언어가 포함된 데이터셋으로 의도적으로 학습되었습니다.
다행히도 BLOOM은 오픈 액세스이므로 누구나 직접 BLOOM을 다운로드해 사용할 수 있습니다. BLOOM과 관련된 모든 자료는 다음의 여러 페이지에서 공개적으로 확인할 수 있습니다. BigScience의 Hugging Face 페이지, 학습 로그부터 다양한 크기의 모델과 체크포인트까지.
데모 페이지에서 시작할 텍스트를 직접 입력하면, 모델이 나머지 내용을 이어서 작성해 줍니다(공유하기 좋게 깔끔하게 포맷된 이미지로도 변환해 줍니다). 제 경험상 좋은 결과를 얻으려면 약간의 시행착오가 필요하지만, 충분히 잘 만든 프롬프트를 제공하면 놀라울 정도로 일관되고 흥미로운 문단을 생성할 수 있습니다.

이 모델은 일본어로 의도적으로 학습된 적이 없지만, 일본어 텍스트도 처리할 수 있습니다. 제가 이해하는 언어가 더 많았다면 다른 언어들도 시험해 봤겠지만, 지원되는 언어에서는 결과가 상당히 좋을 것이라고 확신합니다.

자세히 알아보기
Add a comment