Cohere가 W&B의 도움으로 비즈니스에 중요한 LLM을 교육하는 방법

“Weights & Biases는 다양한 실험과 모델의 가시성 및 비교, ML에 대한 지식 공유 및 문서화, 노력 중복 감소, 궁극적으로 우리가 작업하는 새로운 모델 개발에 도움이 됩니다. Weights & Biases는 우리가 만든 모든 모델을 지원했습니다.”

Nils Reimers
Director of ML, Cohere

Cohere 소개

Cohere 는 모든 계층의 개발자와 모든 규모의 기업에 대규모 언어 모델(LLM)의 힘을 제공하는 데 중점을 둔 언어 AI 회사입니다. 의미 검색, 콘텐츠 조정, 콘텐츠 생성 또는 다른 비즈니스에 중요한 사용 사례에 사용하든 Cohere는 성장하는 고객 기반에 실질적인 차이를 만들어내는 모델을 구축하고 조정하고 있습니다.
 

각 고객을 위한 최상의 모델 교육

아마도 여러분은 LLM에 대해 들어보셨을 겁니다. 결국, LLM은 불과 몇 년 전의 자연어 모델보다 훨씬 더 뛰어난 성과를 거두어 널리 받아들여지고 사용되고 있습니다.
Cohere의 기준 모델은 엄청나게 강력하지만, Cohere 플랫폼을 통해 사용자 정의 기능을 사용할 수 있습니다. 고객은 고유한 데이터 세트를 업로드하고 몇 번의 간단한 클릭으로 사용자 정의 언어 모델을 학습할 수 있으며, 도메인 또는 수직별 작업에 대해 세계에서 가장 강력한 모델 중 일부를 얻을 수 있습니다.
추가 지원이 필요한 기업 고객의 경우 Cohere의 내부 팀이 고객이 백그라운드에서 맞춤형 솔루션을 구축하도록 도울 수 있습니다. 여기에는 종종 고객의 고유한 사용 사례에 가장 적합한 모델을 구축하기 위한 많은 실험이 포함되는데, 예를 들어 소셜 앱에 대한 더 나은 독성 분류기를 제공하거나 마케팅 캠페인에 대한 더 나은 광고 카피를 생성하는 것입니다. 여기서 Weights & Biases(W&B)가 등장합니다.

도전의 범위

더 깊이 파고들기 전에, 대규모 언어 모델이 얼마나 큰지에 대한 수준을 정하는 것이 중요합니다. 예를 들어, Cohere의 모델에는 수십억 개의 매개변수가 포함되어 있습니다. 그리고 LLM의 특성상, 더 작은 규모의 한입 크기 실험은 단순히 효과가 없습니다. 즉, 이러한 모델이 필요한 크기로 확장되었을 때 어떻게 동작할지 정확하게 반영하지 못합니다.
 
Cohere 제품 팀은 고객을 위한 맞춤형 모델을 구축할 때 실험에 Weights & Biases를 사용합니다. W&B 플랫폼은 어떤 고유한 데이터 세트, 하이퍼파라미터 또는 기타 모델 구성이 기업 고객에게 가장 적합한 언어 모델을 생성하는지 기록하고 추적합니다. W&B를 사용하면 중앙 집중식 대시보드를 쉽게 끌어올려 다른 후보 모델보다 성능이 뛰어난 후보 모델을 빠르게 파악하여 가장 효과적인 특정 아키텍처와 데이터 레시피에 대한 통찰력을 얻을 수 있습니다.
 
Cohere의 제품 관리자인 엘리 에반스와 이야기를 나누었는데, 그녀는 간결하게 이렇게 말했습니다. “W&B를 사용하면 모든 후보 모델을 한 번에 검토할 수 있습니다. 견고한 테스트 모음에서 최첨단 결과를 생성하는 모델을 식별할 수 있습니다. 이를 통해 기업 고객에게 특정 애플리케이션에 대한 최첨단 솔루션을 제공할 수 있습니다. 이는 각 고객에게 가장 적합한 모델이 무엇인지 이해하는 데 필수적입니다.”
 
Cohere의 성장하는 제품 팀에서 이 모든 정보에 쉽게 접근할 수 있는 중앙 집중식 작업 공간을 갖는 것은 생산성과 속도에 필수적입니다. 다양한 머신 러닝 엔지니어는 최신 혁신을 과거의 성공 사례와 쉽게 비교할 수 있습니다. 모든 사람이 서로의 가장 뛰어난 아이디어와 실험, 그리고 제대로 작동하지 않은 실험에 대한 가시성을 확보할 수 있습니다. 그리고 마지막 부분은 특히 중요합니다. LLM을 교육하는 것은 비용이 많이 들고 시간이 많이 걸리며, 모델링 시간 낭비를 피하면 컴퓨팅 비용부터 고객의 처리 시간까지 모든 것을 절약할 수 있습니다.
 
이 정보 중 일부는 W&B 보고서에도 포함됩니다. 보고서를 통해 팀 내에서 지식을 공유하고 비기술적 이해 관계자와 소통하는 것이 더 쉬워지고, 회사 내에서 암묵적 지식을 보존하여 향후 참조할 수 있습니다.
 
엘리는 “보고서는 우리에게 큰 도움이 되었습니다.”라고 말했습니다. “보고서를 통해 비기술팀이 소화할 수 있는 방식으로 미묘한 기술 정보를 원활하게 전달할 수 있습니다.”
 

결론

LLM이 모든 산업에서 널리 사용됨에 따라, 사용자 정의 모델을 훈련하고 그 뉘앙스를 이해할 수 있는 회사는 이상적인 위치에 있습니다. Cohere는 방대한 NLP 작업을 해결할 수 있는 기준 모델과 고객에게 더 많은 유연성과 힘을 제공하는 사용자 정의 기능을 갖춘 이 분야의 선두 주자입니다. Cohere를 사용하면 모든 고객이 특정하고 즉각적인 필요에 맞는 올바른 모델을 구축하고 활용할 수 있습니다.
 
모델 크기와 복잡성이 계속 증가함에 따라 대규모 머신 러닝 팀이 없는 소규모 회사는 단순히 자체 모델을 사내에서 훈련할 수 없습니다. LLM은 수백만 달러와 수천 시간의 훈련 비용이 듭니다. Cohere는 이러한 모델의 힘을 그러한 리소스나 전문 지식이 없는 대부분의 회사가 사용할 수 있도록 합니다. 즉, 더 많은 기업이 오늘과 내일 최첨단 모델에 액세스할 수 있다는 의미입니다.