env: MountainCar-v0, algo: ppo
env: CartPole-v1, algo: ppo
env: Acrobot-v1, algo: ppo
env: LunarLander-v2, algo: ppo
env: MountainCarContinuous-v0, algo: ppo
env: BipedalWalker-v3, algo: ppo
env: CarRacing-v0, algo: ppo
env: MountainCar-v0, algo: a2c
env: CartPole-v1, algo: a2c
env: Acrobot-v1, algo: a2c