RLeXplore+RLLTE's PPO+SuperMarioBros

Created on September 29|Last edited on September 29
Comment
﻿
﻿
Disagreement/episode_reward
Disagreement/episode_reward
2k4k6k8kStep0510152025
Weight Initialization=Default
Update Proportion=10%
Update Proportion=1%
Update Proportion=50%
Reward Normalization=Min-Max
Reward Normalization=Vanilla
Observation Normalization=Vanilla
Baseline
with LSTM
E3B/episode_reward
E3B/episode_reward
2k4k6k8kStep051015202530
Update Proportion=1%
Weight Initialization=Default
Update Proportion=10%
Update Proportion=50%
Reward Normalization=Min-Max
Reward Normalization=Vanilla
Baseline
Observation Normalization=Vanilla
with LSTM
ICM/episode_reward
ICM/episode_reward
2k4k6k8kStep0510152025
Weight Initialization=Default
Update Proportion=10%
Update Proportion=1%
Update Proportion=50%
Reward Normalization=Min-Max
Reward Normalization=Vanilla
Observation Normalization=Vanilla
Baseline
with LSTM
PseudoCounts/episode_reward
PseudoCounts/episode_reward
2k4k6k8kStep051015202530
Weight Initialization=Default
Update Proportion=1%
Update Proportion=10%
Update Proportion=50%
Reward Normalization=Min-Max
Reward Normalization=Vanilla
Observation Normalization=Vanilla
with LSTM
Baseline
Run set690
﻿
﻿
Add a comment