Flash-DAPO Table – Weights & Biases

Skip to main content

Llychinalz's workspace

Runs

10

actor_rollout_ref.actor.checkpoint.contents

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/root/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/root/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

-

0

-

-

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

-

-

1166

constant

0.1

1

22528

32

-

false

fsdp

8

true

false

true

true

-

true

-

-

-

/root/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

2s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/workspace/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

45056

32

0

false

fsdp

1

true

false

true

true

false

true

torch

16

0

/workspace/DeepSeek-R1-Distill-Qwen-1.5B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

45056

32

0

false

fsdp

1

true

false

true

true

false

true

torch

16

0

/workspace/DeepSeek-R1-Distill-Qwen-1.5B

Finished

-

llychinalz

2mo ago

2s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/root/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/root/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/workspace/Qwen2.5-32B

Finished

-

llychinalz

2mo ago

1s

-

["model","optimizer","extra"]

0.2

10

0.28

0.2

false

0

false

false

-1

false

true

true

true

0

1

0

low_var_kl

token-mean

0.000001

10

0

0

0.5

1100

constant

0.1

1

22528

32

0

false

fsdp

8

true

false

true

true

false

true

torch

16

0

/workspace/Qwen2.5-32B

1-10

of 10