simple_bench_public Workspace – Weights & Biases

Skip to main content

Assets

Operations

Op

Calls

User

Last updated

Versions

extract_answer:v23

Ivica Baricevic

6 days ago

eval_multi_choice:v41

Ivica Baricevic

6 days ago

Evaluation.evaluate:v6

Ivica Baricevic

6 days ago

Evaluation.summarize:v3

Ivica Baricevic

6 days ago

LiteLLMModel.predict:v219

Ivica Baricevic

6 days ago

Evaluation.predict_and_score:v3

Ivica Baricevic

6 days ago

openai.chat.completions.create:v11

1 month ago

litellm.acompletion:v59

1 month ago

eval_multi_choice_confidence:v0

3 months ago

MajorityVoteModel.predict:v1

6 months ago

eval_majority_vote:v2

6 months ago

debug_scorer:v1

7 months ago

langchain.Parser.PydanticToolsParser:v0

7 months ago

langchain.Chain.ChannelWrite-answer_parser:v0

7 months ago

langchain.Llm.ChatAnthropic:v0

7 months ago

langchain.Chain.ChannelWrite-question_validator:v0

7 months ago

anthropic.Messages.create:v0

7 months ago

langchain.Chain.RunnableSequence:v0

7 months ago

Total Rows: 33