MicroRTS Double-cone, Hyperparam Transitions

Created on May 16|Last edited on May 26

Comment

﻿
﻿
eval/microrts_results_win
eval/microrts_results_win
050M100M150M200M250Mglobal_step00.20.40.60.81
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095
ppo-Microrts-selfplay-dc-phases-maps24-S1-2023-05-19T01:26:19.244633
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-19T01:03:24.744977
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-17T20:35:16.497141
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-16T22:54:34.689524
ppo-Microrts-selfplay-dc-phases-S1-2023-05-16T22:44:50.508414
ppo-Microrts-selfplay-unet-decay-S1-2023-04-11T00:45:13.844240
eval/microrts_stats_WinLossRewardFunction
eval/microrts_stats_WinLossRewardFunction
050M100M150M200M250Mglobal_step-0.500.51
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095
ppo-Microrts-selfplay-dc-phases-maps24-S1-2023-05-19T01:26:19.244633
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-19T01:03:24.744977
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-17T20:35:16.497141
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-16T22:54:34.689524
ppo-Microrts-selfplay-dc-phases-S1-2023-05-16T22:44:50.508414
ppo-Microrts-selfplay-unet-decay-S1-2023-04-11T00:45:13.844240
Run set8
﻿
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610﻿
91d85dd MicroRTSGridModeSharedMemVecEnv isn’t supported
bfe9121 Don’t reward power generation. Reward robot building
cb58909 Give policy hp and resources as floats
8ec7c25 Microrts-selfplay-dc-phases-final adds all maps
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095﻿
ce58e3f Reduce n_epochs to 2 for double-cone microrts
6c5a3dd Replace metal_remaining with factories_to_place
4e033fe Reduce n_epochs from 4 to 2 for Lux to reduce kl-div
﻿ppo-Microrts-selfplay-dc-phases-maps24-S1-2023-05-19T01:26:19.244633﻿
7ed67a8 Get working on A100
cceeda0 Upgrade tensorboard & upgrade java runtime
Need to reduce batchsize for the 24x24 map to 8 minibatches (from 6 on A10 for 16x16 maps)
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-19T01:03:24.744977﻿
28227ab Support for different size maps through padding
2f3729f Copy over vec_env from gym_microrts
d44cf1c Specify wheel url for gym-microrts
4003f90 Point gym-microrts to sgoodfriend fork
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-17T20:35:16.497141﻿
5c0a469 Support for multiple map_paths (limit to save size)
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-16T22:54:34.689524﻿
3f97901 A10 variant of Microrts with double-cone
﻿ppo-Microrts-selfplay-dc-phases-S1-2023-05-16T22:44:50.508414﻿
On A100 to fit 1 training in GPU memory (26.6GB). unet baseline used to fit 3 simultaneous trainings in an A10.
﻿ppo-Microrts-selfplay-unet-decay-S1-2023-04-11T00:45:13.844240﻿
Baseline using unet and decayed rewards
﻿
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610﻿﻿
Run set1
﻿
﻿
﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095﻿﻿
Run set1
﻿
ppo-Microrts-selfplay-dc-phases-maps24-S1-2023-05-19T01:26:19.244633﻿
Run set1
﻿
﻿
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-19T01:03:24.744977﻿
Run set1
﻿
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-17T20:35:16.497141﻿
Run set1
﻿
ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-16T22:54:34.689524﻿
Run set1
﻿
﻿
ppo-Microrts-selfplay-dc-phases-S1-2023-05-16T22:44:50.508414: A100﻿
Run set1
﻿
Baseline﻿
Run set3
﻿
﻿

Add a comment

MicroRTS Double-cone, Hyperparam Transitions

﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610﻿

﻿ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095﻿

ppo-Microrts-selfplay-dc-phases-maps24-S1-2023-05-19T01:26:19.244633

ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-19T01:03:24.744977

ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-17T20:35:16.497141

ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-16T22:54:34.689524

ppo-Microrts-selfplay-dc-phases-S1-2023-05-16T22:44:50.508414: A100

Baseline

ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-25T04:10:09.181610

ppo-Microrts-selfplay-dc-phases-A10-S1-2023-05-24T03:40:49.861095