wandbot

A-sh0ts's workspace

Runs

average_string_distance

chat_accuracy

human_accuracy_score

model_accuracy_score

retrieval_accuracy

Finished

darek

2y ago

15s

0.74249

0.45923

Failed

darek

2y ago

18s

Finished

darek

2y ago

18s

Failed

darek

2y ago

14s

Finished

darek

2y ago

13s

Finished

darek

2y ago

13s

Finished

darek

2y ago

13s

Failed

darek

2y ago

Failed

darek

2y ago

Crashed

megatruong

2y ago

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

Crashed

megatruong

2y ago

1d 11h 13m 44s

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

Crashed

megatruong

2y ago

1d 8h 36m 44s

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

Finished

darek

2y ago

10s

Finished

darek

2y ago

1m 51s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

You are an evaluator for the W&B chatbot. You are given a question, the chatbot's answer, and the original answer, and are asked to score the chatbot's answer as either CORRECT or INCORRECT. Note that sometimes, the original answer is not the best answer, and sometimes the chatbot's answer is not the best answer. You are evaluating the chatbot's answer only. Example Format: QUESTION: question here CHATBOT ANSWER: student's answer here ORIGINAL ANSWER: original answer here GRADE: CORRECT or INCORRECT here Please remember to grade them based on being factually accurate. Begin! QUESTION: {query} CHATBOT ANSWER: {result} ORIGINAL ANSWER: {answer} GRADE:

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

Finished

darek

2y ago

3m 14s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

47.5

0.5

Failed

darek

2y ago

1m 18s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

78.33333

0.66667

Failed

darek

2y ago

1m 35s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

46.33333

0.66667

Failed

darek

2y ago

1m 42s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

Failed

darek

2y ago

1m 41s

gpt-3.5-turbo

true

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

78.33333

Killed

darek

2y ago

1m 48s

gpt-3.5-turbo

false

wandbot/wandbbot/eval_dataset:v0

gpt-3.5-turbo

parambharat/wandb_docs_bot/system_prompt:latest

parambharat/wandb_docs_bot/faiss_store:latest

parambharat/wandb_docs_bot/hyde_prompt:latest

gpt-4

You are a helpful assistant.

1-20

of 35