応用的言語性能
アプリケーション開発能力と安全性評価を強化し、実用的なLLM選定を支援
Created on August 26|Last edited on August 26
Comment
表現 (expression)
MT-bench(roleplay, writing, humanities)
📋 カテゴリ別リーダーボード
Run set
59
翻訳 (translation)
Jaster(alt-e-to-j, alt-j-to-e)
Run set
59
情報検索 (information extraction)
Jaster(jsquad)
Run set
59
Add a comment