alex_ugr

Alex_ugr's workspace

Runs

Killed

alex_ugr

1y ago

9m 18s

SB3-SAC

256

auto

0.99

0.0003

MlpPolicy

LinearReward

Eplus-5zone-hot-continuous-stochastic-v1

SACExperimentExample

3.12.3 (main, Apr 10 2024, 05:33:47) [GCC 13.2.0]

3.3.7

experiment_SAC

training

500

alex_ugr

sinergym

true

sinergym.utils.logger.CSVLogger

true

1000000

auto

100

false

-1

100

auto

Finished

alex_ugr

2y ago

2mo 18d 3h 44m 14s

SB3_PPO

SB3-SAC

256

auto

0.99

0.0003

MlpPolicy

LinearReward

["Eplus-5zone-hot-continuous-stochastic-v1","Eplus-5zone-mixed-continuous-stochastic-v1"]

4.33333

SACExperimentExample

3.10.12 (main, Nov 20 2023, 15:14:05) [GCC 11.4.0]

["3.1.8","3.3.1"]

experiment_SAC

training

500

alex_ugr

sinergym

true

sinergym.utils.logger.CSVLogger

true

1000000

auto

100

false

-1

100

auto

Finished

alex_ugr

2y ago

3h 39m 59s

SB3-SAC

256

auto

0.99

0.0003

MlpPolicy

ExpReward

Eplus-5zone-mixed-continuous-stochastic-v1

SACExperimentExample

3.10.12 (main, Nov 20 2023, 15:14:05) [GCC 11.4.0]

3.2.0

experiment_SAC

training

500

alex_ugr

sinergym

true

sinergym.utils.logger.CSVLogger

true

1000000

auto

100

false

-1

100

auto

Failed

alex_ugr

2y ago

1mo 9d 1h 46m 43s

["SB3-DDPG","SB3-PPO","SB3-SAC","SB3-TD3"]

113.84615

0.2

[0,"auto"]

0.95

0.99

0.00040769

0.5

2048

MlpPolicy

0.69231

0.5

["ExpReward","LinearReward","NormalizedLinearReward"]

["Eplus-5zone-hot-continuous-stochastic-v1","Eplus-5zone-mixed-continuous-stochastic-v1","Eplus-autobalance-mixed-discrete-stochastic-v1"]

18.30769

["DDPGExperimentExample","ExperimentExample","SACExperimentExample","TD3ExperimentExample","lineal_100_0"]

3.10.12 (main, Nov 20 2023, 15:14:05) [GCC 11.4.0]

["3.1.4","3.1.7","3.1.8","3.2.0"]

["experiment1","experiment_DDPG","experiment_SAC","experiment_TD3"]

training

500

alex_ugr

sinergym

true

sinergym.utils.logger.CSVLogger

true

NormalActionNoise(mean=np.array([0]), sigma=np.array([0.1]))

1000000

auto

0.2

100

false

-1

100

auto

0.5

1-4

of 4