env: CartPole-v1, algo: ppo
env: MountainCar-v0, algo: ppo
env: Acrobot-v1, algo: ppo
env: LunarLander-v2, algo: ppo
env: CartPole-v1, algo: a2c
env: MountainCar-v0, algo: a2c
env: Acrobot-v1, algo: a2c
env: MountainCar-v0, algo: dqn
env: CartPole-v1, algo: dqn
env: Acrobot-v1, algo: dqn