As-wandb's workspace
Runs
1,087
Name
1 visualized
Tags
leaderboard
leaderboard3
State
Notes
User
Created
Runtime
Sweep
api
base_config
batch_size
bbq.aaa
custom_prompt_template_en"
custom_prompt_template_en
custom_prompt_template_ja
custom_system_message_en
custom_system_message_ja
generator.max_tokens
generator.presence_penalty
generator.temperature
generator.top_p
github_version
jaster.artifacts_path
jaster.dataset_dir
jaster.language
jaster.message_intro
jaster.system_message
jbbq.aaa
jbbq.artifacts_path
jbbq.dataset_dir
jbbq.language
jmmlu.artifacts_path
jmmlu.dataset_dir
jmmlu.language
jmmlu.system_message
jmmlu_robustness
lctg-bench.artifacts_path
lctg-bench.dataset_dir
lctg.artifacts_path
lctg.dataset_dir
max_model_len
mmlu.artifacts_path
mmlu.dataset_dir
mmlu.language
mmlu.system_message
model.artifacts_path
model.chat_template
model.device_map
model.dtype
model.load_in_4bit
model.load_in_8bit
model.max_model_len
model.pretrained_model_name_or_path
Killed
-
yuya-yamamoto
5h 1m 58s
-
openai_responses
-
16
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
54s
-
openai_responses
-
16
-
-
-
-
-
-
12800
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
8s
-
openai_responses
-
16
-
-
-
-
-
-
12800
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
8h 45m 33s
-
openai_responses
-
16
-
-
-
-
-
-
12800
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
6m
-
openai_responses
-
16
-
-
-
-
-
-
12800
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
34s
-
openai_responses
-
4
-
-
-
-
-
-
12800
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
11h 15m 1s
-
openai_responses
-
4
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
2h 16m 31s
-
openai_responses
-
32
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
1h 59m 10s
-
openai_responses
-
32
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
13m 6s
-
openai_responses
-
32
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
1m 2s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
2h 1m 40s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
6h 28m 13s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-nano-2025-08-07
Killed
-
yuya-yamamoto
6h 28m 40s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-mini-2025-08-07
Killed
-
yuya-yamamoto
6h 28m 48s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
22s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Killed
-
yuya-yamamoto
25s
-
openai_responses
-
8
-
-
-
-
-
-
128000
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
gpt-5-2025-08-07
Finished
-
yuya-yamamoto
1h 2m 7s
-
vllm-external
-
32
-
-
-
-
-
-
8192
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
openai/gpt-oss-20b
Finished
-
yuya-yamamoto
40m 15s
-
vllm-external
-
32
-
-
-
-
-
-
8192
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
openai/gpt-oss-120b
Finished
-
yuya-yamamoto
40m 16s
-
vllm-external
-
32
-
-
-
-
-
-
8192
-
1
1
v3.0.0
wandb-japan/llm-leaderboard3/jaster:v6
jaster
-
以下に、あるタスクを説明する指示があり、それに付随する入力が更なる文脈を提供しています。リクエストを適切に完了するための回答を記述してください。
-
-
wandb-japan/llm-leaderboard3-private/jbbq:v2
jbbq
ja
-
-
-
-
-
-
-
wandb-japan/llm-leaderboard3/lctg:v0
lctg
-
-
-
-
-
-
-
auto
float16
false
false
3000
openai/gpt-oss-120b
1-20
of 263