simple_bench_comp_dataset Workspace – Weights & Biases

Skip to main content

Assets

All assets

Asset

Category

User

Last updated

Versions

extract_answer:v0

Ops

9 months ago

openai.chat.completions.create:v0

Ops

9 months ago

LiteLLMModel:v8

Model

9 months ago

competition_dataset-evaluation:v0

Evaluation

9 months ago

LiteLLMModel.predict:v2

Ops

9 months ago

eval_multi_choice:v0

Ops

9 months ago

Evaluation.predict_and_score:v0

Ops

9 months ago

Evaluation.summarize:v0

Ops

9 months ago

Evaluation.evaluate:v0

Ops

9 months ago

EvaluationResults:v12

EvaluationResults

9 months ago

simple_bench_public-evaluation:v0

Evaluation

9 months ago

simple_bench_competition_hard_set-evaluation:v0

Evaluation

9 months ago

competition_dataset:v0

Dataset

9 months ago

simple_bench_public:v0

Dataset

9 months ago

simple_bench_competition_hard_set:v0

Dataset

9 months ago

Total Rows: 15