deepscaler-1.5b Table – Weights & Biases

Mluo's workspace

Runs

Finished

mluo

10mo ago

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

9420

constant

32768

false

fsdp

true

/home/huangyp_google_com/rllm/verl/global_step_480

true

32768

128

true

bfloat16

true

0.85

false

dummy_dtensor

32768

128

true

Finished

mluo

10mo ago

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

4710

constant

24000

false

fsdp

true

deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

true

24000

128

true

bfloat16

true

0.85

false

dummy_dtensor

24000

128

true

Finished

mluo

10mo ago

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

4710

constant

24000

false

fsdp

true

deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

true

24000

128

true

bfloat16

true

0.85

false

dummy_dtensor

24000

128

true

Finished

mluo

10mo ago

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

9420

constant

32768

false

fsdp

true

/home/huangyp_google_com/rllm/verl/global_step_1040

true

32768

128

true

bfloat16

true

0.85

false

dummy_dtensor

32768

128

true

Finished

mluo

10mo ago

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

4710

constant

24000

false

fsdp

true

deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

true

24000

128

true

bfloat16

true

0.85

false

dummy_dtensor

24000

128

true

1-5

of 5