Skip to main content
wandb-japan
Projects
llm-leaderboard
Reports
Log in
Sign up
Overview
Workspace
Runs
Automat.
Sweeps
Reports
Artifacts
Anyone
Anyone
as-wandb
keisuke-kamata
t-ibi
yuya-yamamoto
Reports
Created by
Created On
Last edited
Nejumi LLMリーダーボード Neo
注目のLLMモデルの日本語能力を言語理解と生成能力の両側面から評価
20
keisuke-kamata
2023-12-07
2 weeks ago
Clone report
Nejumi Leaderboardへの評価依頼方法
0
keisuke-kamata
2024-06-06
1 year ago
Clone report
undefined (24/06/06 14:23:37)
0
as-wandb
2024-06-06
1 year ago
Clone report
Nejumi LLMリーダーボード Neo 改良アイデア
注目のLLMモデルの日本語能力を言語理解と生成能力の両側面から評価
0
yuya-yamamoto
2024-05-31
1 year ago
Clone report
For JSAI 2024
注目のLLMモデルの日本語能力を言語理解と生成能力の両側面から評価
0
yuya-yamamoto
2024-05-26
1 year ago
Clone report
Weave: leaderboard_table (24/05/24 15:46:51)
0
yuya-yamamoto
2024-05-24
1 year ago
Clone report
Weave: leaderboard_table (24/05/15 02:26:05)
0
as-wandb
2024-05-14
1 year ago
Clone report
Nejumi リーダーボード ver.3 Template
0
t-ibi
2024-02-08
2 years ago
Clone report
Jaster Dataset を使った評価における考察
注目のLLMモデルの日本語能力を言語理解と生成能力の両側面から評価
0
keisuke-kamata
2024-01-12
2 years ago
Clone report
backup Nejumi-leaderboard Neo
日本語の一問一答形式のベンチマークタスクと生成タスクの両方の精度を測ったリーダーボードです。
0
keisuke-kamata
2023-12-26
2 years ago
Clone report