Skip to main content

CleanRL PPO + JAX + EnvPool's XLA (w/ and w/o value loss clipping) vs openai/baselins' PPO (part 1)

Created on October 6|Last edited on October 6

Showing first 10 groups
2M4M6M8MSteps50010001500200025003000Episodic Return
Showing first 10 groups
20406080100120Time (minutes)010002000300040005000Episodic Return
CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
5



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
5



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3



CleanRL ppo_atari_envpool_xla_jax.py
3
CleanRL ppo_atari_envpool_xla_vclip_jax.py
3
openai/baselines' PPO
3