ichikara-test Workspace – Weights & Biases

Skip to main content

Traces

All Ops

Filter

inputs

output

model_latency

scores

domain_score

ビジネス

医療

Trace

Feedback

Status

model

question

self

generated_text

mean

mean

mean

Evaluation.evaluate

N/A

ichikara_human_eval:v1

N/A

0.2124

3.7333

3.55

Evaluation.evaluate

N/A

ichikara_human_eval:v1

N/A

0.3216

3.7

3.4

Evaluation.evaluate

N/A

ichikara_human_eval:v1

N/A

0.1772

4.4

4.3

Evaluation.evaluate

N/A

test_20240905:v53

N/A

0.1959

3.6897

3.4

Evaluation.evaluate

N/A

test_20240905:v53

N/A

0.2246

4.4138

4.3

Evaluation.evaluate

N/A

test_20240905:v53

N/A

0.2062

3.7241

3.55

Evaluation.evaluate

N/A

test_20240905:v24

N/A

19.6149

4.6

4.2

Evaluation.evaluate

N/A

test_20240905:v24

N/A

6.6422

4.7333

4.6

Evaluation.evaluate

N/A

test_20240905:v24

N/A

20.7779

4.1667

4.45

LLMinvoke.predict

N/A

All_20240829:v0/attr/rows/id/krFolqiZz0XTskoOckrkoXZZNCJYjjGY8pjH2Hdpwyg/key/text

N/A

N/A

N/A

N/A

LLMinvoke.predict

N/A

All_20240829:v0/attr/rows/id/Eguzbzwnj5PeZu0qCeWZMmYYDOdMBGVuz48qoZMsNcw/key/text

N/A

N/A

N/A

LLMinvoke.predict

N/A

All_20240829:v0/attr/rows/id/KiHgfjASF3lxTenIdKV19wzwGP0EpTHjKsLJc9jnr2E/key/text

N/A

N/A

N/A

LLMinvoke.predict

N/A

All_20240829:v0/attr/rows/id/RnP3lolHodq9bPVvtNsWXYFGSBZxPQOli7fAdyNjpSM/key/text

N/A

N/A

N/A

1-50 of 104

Per page:

50