Pendulum-v1-PG Table – Weights & Biases

Skip to main content

Zhangpaipai's workspace

Runs

1

cur_lr

entropy_loss

env step

episode return mean

grad_norm

policy_loss

return_abs_max

total_loss

train iter

Finished

zhangpaipai

2y ago

30m 7s

-

0.001

-0.001408

4804247

-172.3317

13.60623

-49.59359

408.147

-49.595

1201

1-1

of 1