solver-judge-workflow Table – Weights & Biases

Skip to main content

Listar2000's workspace

Runs

4

actor_rollout_ref.actor.checkpoint.load_contents

actor_rollout_ref.actor.checkpoint.save_contents

Finished

listar2000

1w ago

8m 45s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.28

0.2

false

0

false

false

verl.workers.config.FSDPEngineConfig

false

false

false

false

-1

bfloat16

false

true

true

true

fsdp

1

false

true

0

1

0.001

low_var_kl

seq-mean-token-mean

verl.workers.config.FSDPOptimizerConfig

[0.9,0.999]

1

0.0001

constant

-1

0

0

0.5

3058300

0.01

Crashed

listar2000

3w ago

4h 27m 1s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.28

0.2

false

0

false

false

verl.workers.config.FSDPEngineConfig

false

false

false

false

-1

fp32

false

true

true

true

fsdp

1

false

true

0

1

0.001

low_var_kl

seq-mean-token-mean

verl.workers.config.FSDPOptimizerConfig

[0.9,0.999]

1

0.0001

constant

-1

0

0

0.5

3058300

0.01

Crashed

listar2000

3w ago

3h 26m 45s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.28

0.2

false

0

false

false

verl.workers.config.FSDPEngineConfig

false

false

false

false

-1

fp32

false

true

true

true

fsdp

1

false

true

0

1

0.001

low_var_kl

seq-mean-token-mean

verl.workers.config.FSDPOptimizerConfig

[0.9,0.999]

1

0.00005

constant

-1

0

0

0.5

3058300

0.01

Crashed

listar2000

3w ago

5h 1m 31s

-

verl.workers.config.FSDPActorConfig

verl.trainer.config.CheckpointConfig

false

["model","optimizer","extra"]

["model","optimizer","extra"]

0.2

3

0.28

0.2

false

0

false

false

verl.workers.config.FSDPEngineConfig

false

false

false

false

-1

fp32

false

true

true

true

fsdp

1

false

true

0

1

0.001

low_var_kl

seq-mean-token-mean

verl.workers.config.FSDPOptimizerConfig

[0.9,0.999]

1

0.000001

constant

-1

0

0

0.5

3058300

0.01

1-4

of 4