W&B Weave 뉴스레터: GA, 플레이그라운드, 가드레일, 리더보드 등
Created on December 27|Last edited on December 27
Comment
여러분께 공유드리고 싶은 흥미로운 소식을 전합니다! 이제 W&B Weave를 SaaS 및 AWS 전용 클라우드에서 사용할 수 있게 되었습니다. 이는 12월 2일부터 제공되는 수많은 새로운 Weave 기능과 함께 제공됩니다. 아래 동영상에서 루카스 비왈드(Lukas Biewald) CEO가 리더보드와 주석 템플릿을 비롯한 최신 Weave 기능을 사용하여 에이전트 AI 애플리케이션을 구축하는 방법을 보여드립니다.
금주의 LLM 팁 ✅
o1 프리뷰가 나왔을 때 추론 모델을 살펴보지 않았다면 지금이 다시 한번 살펴볼 수 있는 좋은 시기입니다. 최근 출시된 딥시크 R1과 오픈 소스인 QwQ는 테스트 시간 계산이라는 새로운 종류의 확장 법칙이 존재한다는 것을 확인했으며, 이는 모델이 '생각할' 시간이 길수록 질문에 더 잘 답한다는 것을 보여줍니다. 이를 통해 32B 파라미터 모델은 많은 추론 및 수학 작업에서 405B LLama를 능가하는 성능을 발휘하면서도 맥북 프로와 같은 소비자 하드웨어에서 실행할 수 있습니다.
W&B Weave 뉴스 🚀
리더보드

플레이그라운드

가드 레일(현재 프리뷰버전)
LLM의 비결정적 특성으로 인해 AI가 부적절하게 작동하거나 개인 데이터가 유출될 수 있습니다. 가드레일은 즉시 사용 가능한 필터를 제공하여 유해한 출력을 감지하고 공격을 신속하게 처리합니다. 문제가 감지되면 사전 및 사후 후크를 통해 안전장치를 트리거할 수 있습니다.
평가(현재 프리뷰버전)
온라인 평가를 사용하면 프로덕션에서 실시간 추적을 점수화하여 애플리케이션을 실시간으로 모니터링할 수 있습니다. 온라인 평가를 통해 개발자는 평가를 핵심 애플리케이션 처리와 분리할 수 있습니다.
커뮤니티 🏡
이제 𝕏에 W&B Weave 전용 홈(@weave_wb)이 생겼습니다. Weave 제품 개발에 대한 최신 정보를 제공하고, LLM 팁과 요령을 공유하며, 프로덕션 GenAI 애플리케이션에 대한 모범 사례를 소개하는 등 다양한 소식을 전해드립니다. 팔로우해 주세요.
또한 Weave GA 출시와 함께 AI 에반젤리스트인 알렉스 볼코프가 𝕏에서 자신 있게 LLM 애플리케이션을 제품화할 수 있는 간소화된 4단계 쿡북을 공유했습니다. 이곳에서 확인하세요.
인기 기사 📑
AWS re:Invent 2024를 기념하여 Amazon Bedrock에서 가중치 및 편향을 사용하는 방법에 대한 기사를 게시했습니다:
텍스트 요약을 위한 Amazon Bedrock의 LLM과 W&B Weave 비교하기
Amazon Bedrock과 Weave를 함께 사용하여 요약 작업을 위한 LLM을 평가하고 비교하는 방법과 Bedrock의 관리형 인프라와 Weave의 고급 평가 기능을 활용하는 방법을 알아보세요.
Add a comment
Iterate on AI agents and models faster. Try Weights & Biases today.