wandb-korea

Cookie96's workspace

Runs

112

mtbench.conv_role_message_separator

mtbench.conv_system_message

Finished

mario109745

leaderboard

1y ago

1h 12m 18s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

gemma-9b-it

["None"]

None

1.1.0

open llm

auto

false

/data/jupyterlab/mergekit/merged_gemma-base

true

false

korean_mt_bench

custom

<end_of_turn>

('user', 'model')

['<eos>', '<end_of_turn>']

[1, 107]

다음은 작업을 설명하는 지시와 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

1y ago

1h 13m 51s

false

[|system|]You are EXAONE model from LG AI Research, a helpful assistant.　[|endofturn|] [|user|] 다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오. 지시: {instruction} 입력: {input} 답변: [|assistant|]

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Failed

keisuke-kamata

1y ago

19s

false

[|system|]You are EXAONE model from LG AI Research, a helpful assistant.　[|endofturn|] [|user|] 다음은 작업을 설명하는 지침과 추가 배�� 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오. 지시: {instruction} 입력: {input} 답변: [|assistant|]

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

1y ago

1h 24m 28s

false

[|system|]You are EXAONE model from LG AI Research, a helpful assistant.　[|endofturn|] [|user|] 다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오. 입력: {input} 답변: [|assistant|]

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

1y ago

6m 52s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

1y ago

7m 50s

false

[|system|]You are EXAONE model from LG AI Research, a helpful assistant.　 다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.[|endofturn|] [|user|]입력: {input} [|assistant|]

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Killed

keisuke-kamata

1y ago

2m 1s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Failed

keisuke-kamata

1y ago

4m 53s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Failed

keisuke-kamata

1y ago

20s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Killed

keisuke-kamata

1y ago

56s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Killed

keisuke-kamata

1y ago

42m 12s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Failed

keisuke-kamata

1y ago

13s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Failed

keisuke-kamata

1y ago

25s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

["None"]

None

1.1.0

open llm

auto

false

LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct

true

false

korean_mt_bench

custom

<|eot_id|>

[|endofturn|]

('[|user|]', '[|assistant|]')

[|endofturn|]

[<|end_of_text|>, <|eot_id|>]

[128001, 128009]

다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

hasangchun

leaderboard

1y ago

1h 41m 8s

false

<start_of_turn>user {instruction} {input}<end_of_turn> <start_of_turn>model

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

rtzr/ko-gemma-2-9b-it

["None"]

None

1.1.0

open llm

auto

false

rtzr/ko-gemma-2-9b-it

true

false

korean_mt_bench

custom

<end_of_turn>

('<start_of_turn>user', '<start_of_turn>model')

['<eos>', '<end_of_turn>']

[1, 107]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

hasangchun

1y ago

12m 47s

false

<start_of_turn>user {instruction} {input}<end_of_turn> <start_of_turn>model

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

rtzr/ko-gemma-2-9b-it

["None"]

None

1.1.0

open llm

auto

false

rtzr/ko-gemma-2-9b-it

true

false

korean_mt_bench

custom

<end_of_turn>

('<start_of_turn>user', '<start_of_turn>model')

<end_of_turn>

['<eos>', '<end_of_turn>']

[1]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

hasangchun

1y ago

1h 30m 48s

false

<start_of_turn>user {instruction} {input}<end_of_turn> <start_of_turn>model

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

rtzr/ko-gemma-2-9b-it

["None"]

None

1.1.0

open llm

auto

false

rtzr/ko-gemma-2-9b-it

true

false

korean_mt_bench

custom

<end_of_turn>

('<start_of_turn>user', '<start_of_turn>model')

<end_of_turn>

['<eos>', '<end_of_turn>']

[1]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하�� 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

acryl_llm

leaderboard

1y ago

1h 32m 6s

false

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

./logs

2048

AcrylaLLM/Llama-3-8B-Jonathan-aLLM-Instruct-v1.0

["None"]

None

1.1.0

open llm

auto

false

AcrylaLLM/Llama-3-8B-Jonathan-aLLM-Instruct-v1.0

true

false

korean_mt_bench

custom

('지시', '응답')

###

<|end_of_text|>

[128001]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

leaderboard

1y ago

1h 29m 6s

false

<s> ### User:다음은 작업을 설명하는 지침과 추가 배경 정보를 제공하는 입력의 조합입니다. 요청을 적절하게 충족하는 답변을 작성하십시오. {instruction} {input} ### Assistant:

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

upstage/SOLAR-10.7B-Instruct-v1.0

["None"]

None

1.1.0

auto

false

upstage/SOLAR-10.7B-Instruct-v1.0

true

false

korean_mt_bench

custom

('User', 'Assistant')

###

[2]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

keisuke-kamata

leaderboard

1y ago

2h 35m 24s

upstage

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

upstage/solar-1-mini-chat

["None"]

None

1.1.0

commercial api

auto

false

upstage/solar-1-mini-chat

true

false

korean_mt_bench

custom

('지시', '응답')

###

[2]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

true

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

Finished

cookie96

leaderboard

1y ago

1h 54m 31s

amazon_bedrock

wandb-korea/korean-llm-leaderboard/kaster:v0

/kaster/test

0.1

v2.0.0

./logs

2048

anthropic.claude-3-opus-20240229-v1:0

["None"]

None

1.1.0

commercial

auto

false

anthropic.claude-3-opus-20240229-v1:0

true

false

korean_mt_bench

custom

('USER','ASSISTANT')

[0]

다음은 작업을 설명하는 지침과 컨텍스트 입력의 조합입니다. 요구를 적절하게 만족시키는 응답을 적으십시오.

false

bfloat16

gpt-4

wandb-korea/korean-llm-leaderboard/mtbench_ko_prompt:v0

1024

single

1-20

of 112