simple_bench_public Workspace – Weights & Biases

Skip to main content

Assets

All assets

Asset

Category

User

Last updated

Versions

EvaluationResults:v8046

EvaluationResults

1 week ago

LiteLLMModel:v4847

Model

1 week ago

LiteLLMModel.predict:v223

Ops

1 week ago

extract_answer:v24

Ops

1 week ago

openai.chat.completions.create:v12

Ops

1 week ago

Evaluation

1 week ago

Evaluation.predict_and_score:v3

Ops

1 week ago

Evaluation.evaluate:v6

Ops

1 week ago

Evaluation.summarize:v3

Ops

1 week ago

eval_multi_choice:v42

Ops

1 week ago

Dataset

1 week ago

litellm.acompletion:v59

Ops

2 months ago

eval_multi_choice_confidence:v0

Ops

4 months ago

competition_dataset-evaluation:v36

Evaluation

Agata Mlynarczyk

6 months ago

MajorityVoteModel:v113

Model

7 months ago

MajorityVoteModel.predict:v1

Ops

7 months ago

eval_majority_vote:v2

Ops

7 months ago

debug_scorer:v1

Ops

8 months ago

Total Rows: 53