e2e-hiring-assistant Workspace – Weights & Biases

Skip to main content

Evaluations

Filter

inputs

output

decision_match

model_latency

model_output

decision_match

has_hallucination

Trace

Feedback

Status

model

self

true_count

true_fraction

mean

true_count

true_fraction

eval-2025-03-05-rich-island

HiringAgent:v46

evaluation_dataset-evaluation:v12

13

0.9286

67.2868

5

0.3571

eval-2025-03-05-nice-daisy

HiringAgent:v45

evaluation_dataset-evaluation:v12

14

0.8235

34.5554

0

0

eval-2025-03-03-gentle-rose

HiringAgent:v38

evaluation_dataset-evaluation:v11

N/A

N/A

0.4417

N/A

N/A

eval-2025-02-26-unique-hill

HiringAgent:v23

evaluation_dataset-evaluation:v10

6

1

78.6385

0

0

eval-2025-02-26-friendly-mountain

HiringAgent:v23

evaluation_dataset-evaluation:v9

4

1

58.682

0

0

eval-2025-02-26-brave-rain

HiringAgent:v22

evaluation_dataset-evaluation:v8

6

1

109.3506

1

0.1667

eval-2025-02-09-dazzling-meadow

evaluation_dataset-evaluation:v7

6

1

196.7072

0

0

eval-2025-02-09-fierce-dolphin

evaluation_dataset-evaluation:v6

6

1

115.2909

1

0.1667

eval-2025-02-09-graceful-lake

evaluation_dataset-evaluation:v2

1

0.25

87.7583

1

0.25

eval-2025-02-04-nice-forest

evaluation_dataset-evaluation:v1

3

0.6

288.7976

0

0

eval-2025-02-04-jubilant-wind

evaluation_dataset-evaluation:v0

4

0.8

279.8493

0

0

1-11 of 11

Per page:

50