xk-huang

Xk-huang's workspace

Runs

3d 39m 2s

9h 46m 7s

5h 52m 57s

actor_rollout_ref.actor.checkpoint.load_contents

actor_rollout_ref.actor.checkpoint.save_contents

critic.checkpoint.load_contents

critic.checkpoint.save_contents

actor/entropy_loss

actor/grad_norm

actor/kl_loss

actor/pg_clipfrac

actor/pg_loss

actor/ppo_kl

645

Qwen/Qwen2.5-VL-32B-Instruct

645

true

128

/opt/dlami/nvme/xhuan192/codes/med-vlrm/data/verl/med-vlm-m23k-qwen2_5_vl_3b-easy_to_hard/train.parquet

Qwen/Qwen2.5-VL-32B-Instruct

checkpoints/med-vlrm/train-qwen2_5_vl_7b-m23k

train-qwen2_5_vl_7b-m23k

["model","optimizer","extra"]

false

torch

false

true

false

["model","optimizer","extra"]

false

5mo ago

Jun 19 '25 22:29

illpepzw

Finished

Jun 19 '25 22:29

0.17737

0.051244

0.0008924

-0.033434

0.00014574

320

128

Qwen/Qwen2.5-VL-7B-Instruct

320

128

true

256

data/verl/med-vlm-m23k-qwen2_5_vl_3b-easy_to_hard/train.parquet

Qwen/Qwen2.5-VL-7B-Instruct

checkpoints/med-vlrm/train-qwen2_5_vl_7b-m23k

train-qwen2_5_vl_7b-m23k

95a6f24c09559248ddb2b7e77f9b25eb2f138e0f

5mo ago

https://github.com/xk-huang/med-vlrm/tree/95a6f24c09559248ddb2b7e77f9b25eb2f138e0f

Jun 06 '25 07:15

6y1xmm9y

Finished

Jun 06 '25 07:15

0.79866

0.34715

0.045927

0.00055478

0.10208

-0.00013131

320

128

Qwen/Qwen2.5-VL-3B-Instruct

320

128

true

256

data/verl/med-vlm-m23k-qwen2_5_vl_3b-easy_to_hard/train.parquet

Qwen/Qwen2.5-VL-3B-Instruct

checkpoints/med-vlrm/train-qwen2_5_vl_3b-m23k

train-qwen2_5_vl_3b-m23k

5977eb7030292a112eb8a3254a82f2fd9bac0243

5mo ago

https://github.com/xk-huang/med-vlrm/tree/5977eb7030292a112eb8a3254a82f2fd9bac0243

Jun 06 '25 01:47

vts1pbwr

Finished

Jun 06 '25 01:47

1.18377

0.33439

0.021837

0.00034077

-0.026197

-0.000076161

1-3

of 3