search_r1_like_async_rl Table

Yoon1001's workspace

Runs

actor_rollout_ref.actor.checkpoint.contents

Running

yoon1001

21h ago

20h 49m 46s

0.2

-1

false

true

low_var_kl

token-mean

0.000005

-1

0.285

0.5

353

0.01

16384

256

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Crashed

yoon1001

3d ago

1d 19h 58m 45s

0.2

-1

false

true

low_var_kl

token-mean

0.000005

-1

0.285

0.5

353

0.01

16384

256

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Finished

yoon1001

4d ago

18h 15m 28s

0.2

-1

false

true

low_var_kl

token-mean

0.000005

-1

0.285

0.5

662

0.01

16384

256

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Crashed

yoon1001

4d ago

15m 31s

0.2

-1

false

true

low_var_kl

token-mean

0.000005

-1

0.285

0.5

662

0.01

16384

256

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Base

all-linear

false

Crashed

yoon1001

4d ago

1h 11m 31s

0.2

-1

false

true

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

21201

0.01

16384

false

fsdp2

false

true

false

true

Qwen/Qwen2.5-3B-Instruct

all-linear

false

Crashed

yoon1001

4d ago

9m 31s

0.2

-1

false

true

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

21201

0.01

16384

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Crashed

yoon1001

4d ago

2h 16m 1s

0.2

-1

false

true

0.001

low_var_kl

token-mean

0.000001

-1

0.285

0.5

662

0.01

16384

256

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Crashed

yoon1001

4d ago

1h 16s

0.2

-1

false

true

0.001

low_var_kl

token-mean

0.000001

-1

0.285

0.5

5300

0.01

16384

false

fsdp2

false

true

false

true

Qwen/Qwen3-4B-Instruct-2507

all-linear

false

Crashed

yoon1001

4mo ago

5h 15m 33s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

4mo ago

7h 13m 15s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

4mo ago

7h 14m 31s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Finished

yoon1001

5mo ago

4h 25m 57s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

5mo ago

57m

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

5mo ago

6h 50m 1s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Finished

yoon1001

5mo ago

24m 26s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

5mo ago

6h 14m 16s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

5mo ago

5h 4m 31s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Finished

yoon1001

5mo ago

1h 23m 31s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Crashed

yoon1001

5mo ago

56m 3s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

662

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

Finished

yoon1001

5mo ago

2h 35m 19s

["model","optimizer","extra"]

0.03

0.2

-1

false

true

0.001

low_var_kl

token-mean

5.0000e-7

-1

0.285

0.5

662

constant

0.01

16384

256

false

fsdp

false

true

false

true

Qwen/Qwen2.5-7B-Instruct

all-linear

false

1-20

of 40