simple_bench_public Workspace – Weights & Biases

Skip to main content

Assets

All assets

Asset

Category

User

Last updated

Versions

extract_answer:v23

Ops

Ivica Baricevic

1 week ago

Evaluation

Ivica Baricevic

1 week ago

eval_multi_choice:v41

Ops

Ivica Baricevic

1 week ago

EvaluationResults:v8041

EvaluationResults

Ivica Baricevic

1 week ago

LiteLLMModel:v4843

Model

Ivica Baricevic

1 week ago

Evaluation.evaluate:v6

Ops

Ivica Baricevic

1 week ago

Evaluation.summarize:v3

Ops

Ivica Baricevic

1 week ago

LiteLLMModel.predict:v219

Ops

Ivica Baricevic

1 week ago

Evaluation.predict_and_score:v3

Ops

Ivica Baricevic

1 week ago

Dataset

Ivica Baricevic

1 week ago

openai.chat.completions.create:v11

Ops

1 month ago

litellm.acompletion:v59

Ops

1 month ago

eval_multi_choice_confidence:v0

Ops

3 months ago

competition_dataset-evaluation:v36

Evaluation

Agata Mlynarczyk

5 months ago

MajorityVoteModel:v113

Model

6 months ago

MajorityVoteModel.predict:v1

Ops

6 months ago

eval_majority_vote:v2

Ops

6 months ago

debug_scorer:v1

Ops

7 months ago

Total Rows: 53