知識・質問応答
アプリケーション開発能力と安全性評価を強化し、実用的なLLM選定を支援
Created on August 26|Last edited on August 26
Comment
一般的知識 (general knowledge)
Jaster(jcommonsenseqa, jemhopqa, niilc, aio), MT-bench(stem)
📋 カテゴリ別リーダーボード
Run set
59
専門的知識 (expert knowledge)
Jaster(jmmlu, mmlu_prox_ja), HLE
Run set
59
Add a comment