Debug Async

Created on July 25|Last edited on September 10
Comment
﻿
﻿
charts/avg_episodic_return
charts/avg_episodic_return
2M4M6M8M10Mglobal_step0100200300400500
charts/SPS
charts/SPS
2M4M6M8M10Mglobal_step50010001500200025003000
charts/learning_rate
charts/learning_rate
2M4M6M8M10Mglobal_step00.000050.00010.000150.0002
losses/approx_kl
losses/approx_kl
2M4M6M8M10Mglobal_step0.050.10.150.2
losses/entropy
losses/entropy
2M4M6M8M10Mglobal_step0.60.811.2
losses/policy_loss
losses/policy_loss
2M4M6M8M10Mglobal_step-0.03-0.02-0.0100.010.02
 
ppo_atari_envpool_soft_async_jax.py (off by 1 rewards)1
 
ppo_atari_envpool_async_jax.py (off by 1 rewards)1
 
baselines3
ppo_atari_envpool_soft_async_jax.py1
ppo_atari_envpool_async_jax.py1
﻿
﻿
﻿
baselines14
ppo_atari_envpool_async_jax.py1
﻿
﻿
﻿
﻿
Add a comment