OPT-IML: Meta, 새로운 지시학습 기반 OPT 모델과 NLP 작업용 벤치마크 공개
Meta AI가 OPT 기반의 오픈소스 NLP 모델 세트인 OPT-IML을 공개했다. 이 모델들은 신규 지시 과제 벤치마크인 OPT-IML Bench로 미세조정되었다. 이 기사는 AI 번역본입니다. 오역이 있으면 댓글로 알려주세요.
Created on September 15|Last edited on September 15
Comment
메타 AI는 오늘 발표하고 공개했다 OPT-IML, OPT 기반의 신규 NLP 모델 컬렉션 OPT 모델이 모델들은 OPT-IML Bench라는 신규 지시 튜닝 벤치마크로 미세조정되었다.
OPT-IML의 성능
OPT-IML(오픈 사전학습 변환기-지시 메타러닝)은 기반이 된 OPT 모델과 아키텍처 측면에서 동일하다. 차이점은 새로 구축된 OPT-IML Bench 벤치마크로 파인튜닝되었다는 점뿐이다. 이 벤치마크는 여러 기존 벤치마크를 결합해 다양한 대규모 과제 집합을 구성하고, 이를 통해 파인튜닝할 수 있도록 만들어졌다.

OPT-IML에는 두 가지 모델 크기가 있다: 30B와 175B. OPT-IML은 14개의 표준 NLP 평가 과제 전반에서 기반 OPT 모델보다 평균적으로 더 나은 성능을 보였다. 제로샷 과제에서는 두 모델 크기 모두 약 7% 향상되었고, 32샷 과제에서는 각각 30B가 약 4%, 175B가 약 0.4% 향상되었다.

OPT-IML은 오픈소스다. 30B 모델 가중치는 바로 내려받을 수 있고, 175B 모델은 제공되면 요청 양식을 통해 요청할 수 있다. GitHub 저장소자세한 내용은 전체 연구 논문에서 이 모델들과 새로운 벤치마크에 대해 모두 확인할 수 있다 여기.
Add a comment