jonhue

Jonhue's workspace

Runs

actor_rollout_ref.actor.checkpoint.contents

Finished

jonhue

2d ago

10s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

2m 16s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

2m 16s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

10s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

2m 7s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

54s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

58s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

1m 7s

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

Finished

jonhue

2d ago

["model","optimizer","extra"]

0.2

0.28

0.2

-1

false

0.001

low_var_kl

token-mean

0.000001

-1

250

constant

0.01

10240

false

fsdp

false

true

Qwen/Qwen3-8B

false

true

10240

false

fsdp

true

1-20

of 48