benchmark_over_sample_2 Table – Weights & Biases

Skip to main content

Zhaochenyang20's workspace

Runs

4

•

•

•

•

actor_rollout_ref.actor.checkpoint.load_contents

actor_rollout_ref.actor.checkpoint.save_contents

Crashed

Add notes...

zhaochenyang20

6d ago

43m 33s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.2

0.2

false

0

false

verl.workers.config.FSDPEngineConfig

false

-1

false

false

false

true

0

1

0.001

low_var_kl

token-mean

verl.workers.config.FSDPOptimizerConfig

0.000001

-1

0

0

0.5

435

constant

0.01

verl.workers.config.PolicyLossConfig

1

0.0002

5

0.0002

vanilla

0.1

1

16384

32

256

Crashed

Add notes...

zhaochenyang20

6d ago

43m 31s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.2

0.2

false

0

false

verl.workers.config.FSDPEngineConfig

false

-1

false

false

false

true

0

1

0.001

low_var_kl

token-mean

verl.workers.config.FSDPOptimizerConfig

0.000001

-1

0

0

0.5

435

constant

0.01

verl.workers.config.PolicyLossConfig

1

0.0002

5

0.0002

vanilla

0.1

1

16384

32

256

Crashed

Add notes...

zhaochenyang20

6d ago

43m 16s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.2

0.2

false

0

false

verl.workers.config.FSDPEngineConfig

false

-1

false

false

false

true

0

1

0.001

low_var_kl

token-mean

verl.workers.config.FSDPOptimizerConfig

0.000001

-1

0

0

0.5

435

constant

0.01

verl.workers.config.PolicyLossConfig

1

0.0002

5

0.0002

vanilla

0.1

1

16384

32

256

Crashed

Add notes...

zhaochenyang20

6d ago

43m 15s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.2

0.2

false

0

false

verl.workers.config.FSDPEngineConfig

false

-1

false

false

false

true

0

1

0.001

low_var_kl

token-mean

verl.workers.config.FSDPOptimizerConfig

0.000001

-1

0

0

0.5

435

constant

0.01

verl.workers.config.PolicyLossConfig

1

0.0002

5

0.0002

vanilla

0.1

1

16384

32

256

1-4

of 4