Cookie96's workspace
Runs
112
Name
112 visualized
State
Notes
User
Tags
Created
Runtime
Sweep
api
custom_prompt_template
dataset_artifact
dataset_dir
generator.repetition_penalty
generator.temperature
generator.top_k
generator.top_p
github_version
log_dir
max_seq_length
metainfo.basemodel_name
metainfo.instruction_tuning_data
metainfo.instruction_tuning_method
metainfo.llm-jp-eval-version
metainfo.llm-kr-eval-version
metainfo.model_type
metainfo.num_few_shots
model.artifacts_path
model.device_map
model.load_in_4bit
model.load_in_8bit
model.pretrained_model_name_or_path
model.trust_remote_code
model.use_wandb_artifacts
mtbench.bench_name
mtbench.conv_name
mtbench.conv_role_message_separator
mtbench.conv_role_only_separator
mtbench.conv_roles
mtbench.conv_sep
mtbench.conv_stop_str
mtbench.conv_stop_token_ids
mtbench.conv_system_message
mtbench.custom_conv_template
mtbench.dtype
mtbench.judge_model
mtbench.judge_prompt_artifacts_path
mtbench.max_new_token
mtbench.mode
Finished
-
mario109745
leaderboard
1h 12m 18s
-
false
-
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
gemma-9b-it
["None"]
None
1.1.0
-
open llm
0
auto
false
false
/data/jupyterlab/mergekit/merged_gemma-base
true
false
korean_mt_bench
custom
<end_of_turn>
('user', 'model')
['<eos>', '<end_of_turn>']
[1, 107]
다음은 작업을 설명하는 지시와 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
1h 13m 51s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant. [|endofturn|]
[|user|]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
지시:
{instruction}
입력:
{input}
답변:
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Failed
-
keisuke-kamata
19s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant. [|endofturn|]
[|user|]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
지시:
{instruction}
입력:
{input}
답변:
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
1h 24m 28s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant. [|endofturn|]
[|user|]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
입력:
{input}
답변:
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
6m 52s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant. [|endofturn|]
[|user|]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
입력:
{input}
답변:
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
7m 50s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Killed
-
keisuke-kamata
2m 1s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Failed
-
keisuke-kamata
4m 53s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Failed
-
keisuke-kamata
20s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Killed
-
keisuke-kamata
56s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Killed
-
keisuke-kamata
42m 12s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Failed
-
keisuke-kamata
13s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Failed
-
keisuke-kamata
25s
-
false
[|system|]You are EXAONE model from LG AI Research, a helpful assistant.
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|]
[|user|]입력:
{input}
[|assistant|]
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
["None"]
None
1.1.0
-
open llm
0
auto
false
false
LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
true
false
korean_mt_bench
custom
<|eot_id|>
[|endofturn|]
('[|user|]', '[|assistant|]')
[|endofturn|]
[<|end_of_text|>, <|eot_id|>]
[128001, 128009]
다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
hasangchun
leaderboard
1h 41m 8s
-
false
<start_of_turn>user
{instruction}
{input}<end_of_turn>
<start_of_turn>model
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
rtzr/ko-gemma-2-9b-it
["None"]
None
1.1.0
-
open llm
0
auto
false
false
rtzr/ko-gemma-2-9b-it
true
false
korean_mt_bench
custom
<end_of_turn>
('<start_of_turn>user', '<start_of_turn>model')
['<eos>', '<end_of_turn>']
[1, 107]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절��게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
hasangchun
12m 47s
-
false
<start_of_turn>user
{instruction}
{input}<end_of_turn>
<start_of_turn>model
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
rtzr/ko-gemma-2-9b-it
["None"]
None
1.1.0
-
open llm
0
auto
false
false
rtzr/ko-gemma-2-9b-it
true
false
korean_mt_bench
custom
<end_of_turn>
<end_of_turn>
('<start_of_turn>user', '<start_of_turn>model')
<end_of_turn>
['<eos>', '<end_of_turn>']
[1]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
hasangchun
1h 30m 48s
-
false
<start_of_turn>user
{instruction}
{input}<end_of_turn>
<start_of_turn>model
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
rtzr/ko-gemma-2-9b-it
["None"]
None
1.1.0
-
open llm
0
auto
false
false
rtzr/ko-gemma-2-9b-it
true
false
korean_mt_bench
custom
<end_of_turn>
<end_of_turn>
('<start_of_turn>user', '<start_of_turn>model')
<end_of_turn>
['<eos>', '<end_of_turn>']
[1]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
acryl_llm
leaderboard
1h 32m 6s
-
false
-
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
-
./logs
2048
AcrylaLLM/Llama-3-8B-Jonathan-aLLM-Instruct-v1.0
["None"]
None
1.1.0
-
open llm
0
auto
false
false
AcrylaLLM/Llama-3-8B-Jonathan-aLLM-Instruct-v1.0
true
false
korean_mt_bench
custom
:
:
('지시', '응답')
###
<|end_of_text|>
[128001]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
leaderboard
1h 29m 6s
-
false
<s> ### User:다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.
{instruction}
{input}
### Assistant:
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
upstage/SOLAR-10.7B-Instruct-v1.0
["None"]
None
1.1.0
-
0
auto
false
false
upstage/SOLAR-10.7B-Instruct-v1.0
true
false
korean_mt_bench
custom
:
:
('User', 'Assistant')
###
###
[2]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
keisuke-kamata
leaderboard
2h 35m 24s
-
upstage
-
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
upstage/solar-1-mini-chat
["None"]
None
1.1.0
-
commercial api
0
auto
false
false
upstage/solar-1-mini-chat
true
false
korean_mt_bench
custom
:
:
('지시', '응답')
###
###
[2]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
true
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
Finished
-
cookie96
leaderboard
1h 54m 31s
-
amazon_bedrock
-
wandb-korea/korean-llm-leaderboard/kaster:v0
/kaster/test
1
0.1
0
1
v2.0.0
./logs
2048
anthropic.claude-3-opus-20240229-v1:0
["None"]
None
1.1.0
-
commercial
0
auto
false
false
anthropic.claude-3-opus-20240229-v1:0
true
false
korean_mt_bench
custom
:
:
('USER','ASSISTANT')
[0]
다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.
false
bfloat16
gpt-4
wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0
1024
single
1-20
of 112