Gym-MicroRTS: Our PPO + action mask vs Our PPO vs vs openai/baselines' PPO