Skip to main content

CleanRL PPO + JAX + EnvPool's XLA (w/ and w/o value loss clipping) vs openai/baselins' PPO (part 2)

Created on October 6|Last edited on October 6

Showing first 10 groups
2M4M6M8MSteps200040006000800010000Episodic Return
Showing first 10 groups
20406080100120140Time (minutes)0200040006000800010000Episodic Return
CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
5



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
5
openai/baselines' PPO
3