Skip to main content

Slimshadys's group workspace

Timestamps visible
2023-12-09 19:43:44
--------BEGIN ITERATION REPORT--------
2023-12-09 19:43:44
Policy Reward: -225,87839
2023-12-09 19:43:44
Policy Entropy: 0,48903
2023-12-09 19:43:44
Value Function Loss: 0,04896
2023-12-09 19:43:44
Mean KL Divergence: 0,00454
2023-12-09 19:43:44
SB3 Clip Fraction: 0,04099
2023-12-09 19:43:44
Policy Update Magnitude: 0,07963
2023-12-09 19:43:44
Value Function Update Magnitude: 0,07235
2023-12-09 19:43:44
Collected Steps per Second: 8.214,62918
2023-12-09 19:43:44
Overall Steps per Second: 6.384,58735
2023-12-09 19:43:44
Timestep Collection Time: 6,08987
2023-12-09 19:43:44
Timestep Consumption Time: 1,74556
2023-12-09 19:43:44
PPO Batch Consumption Time: 0,14904
2023-12-09 19:43:44
Total Iteration Time: 7,83543
2023-12-09 19:43:44
Cumulative Model Updates: 2.761
2023-12-09 19:43:44
Cumulative Timesteps: 69.081.448
2023-12-09 19:43:44
Timesteps Collected: 50.026
2023-12-09 19:43:44
--------END ITERATION REPORT--------
2023-12-09 19:43:44
Saving checkpoint 69081448...
2023-12-09 19:43:44
Checkpoint 69081448 saved!