Skip to main content

応用的言語性能

アプリケーション開発能力と安全性評価を強化し、実用的なLLM選定を支援
Created on August 26|Last edited on August 26

表現 (expression)

MT-bench(roleplay, writing, humanities)


📋 カテゴリ別リーダーボード

roleplay_mtbench
writing_mtbench
humanities_mtbench
model_name
43
3
8
4
2
48
run.name
AVG
Run set
59



翻訳 (translation)

Jaster(alt-e-to-j, alt-j-to-e)

Run set
59



情報検索 (information extraction)

Jaster(jsquad)

Run set
59


List<File<(table)>>