deepcoder Table – Weights & Biases

Mluo's workspace

Runs

Finished

mluo

6mo ago

rllm/deepscaler/lneoh94r

0.2

0.0015

-1

false

0.0001

low_var_kl

5.0000e-7

2130

constant

27000

false

fsdp

true

false

true

checkpoints/deepscaler/deepscaler-code-32k-easy/global_step_320/actor/checkpoint

true

27000

true

bfloat16

true

Finished

mluo

6mo ago

AxT-dev/deepcoder/a4rjh1cu

0.2

0.28

0.2

-1

false

low_var_kl

0.000001

22000

constant

24000

false

fsdp

true

false

true

/data/mluo/checkpoints/deepcoder/14b-16k-grpo-code/actor/global_step_160

true

24000

128

true

bfloat16

true

Finished

mluo

6mo ago

AxT-dev/deepcoder/iu8ofnf4

0.2

0.28

0.2

-1

false

low_var_kl

0.000001

22000

constant

20000

false

fsdp

true

false

true

checkpoints/deepcoder/14b-16k-grpo-code/actor/global_step_10

true

false

20000

128

true

bfloat16

true

Finished

mluo

6mo ago

AxT-dev/deepcoder/igrku3m2

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

22000

constant

20000

false

fsdp

true

deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

true

false

20000

128

true

bfloat16

true

Finished

mluo

6mo ago

AxT-dev/deepcoder/vmj9litd

0.2

0.001

-1

false

0.001

low_var_kl

0.000001

22000

constant

20000

false

fsdp

true

deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

true

false

20000

128

true

bfloat16

true

1-5

of 5