Qwen2.5-Coder-3B SFT on Reasoning Datasets

Created on February 16|Last edited on February 16

Comment

﻿
﻿
train/grad_norm
train/grad_norm
50100150200250300train/global_step12345
qwen-3b_s1k_v00.00
qwen-3b_s1k_v00.03
qwen-3b_s1k_v00.04
qwen-3b_s1k_v00.02
qwen-3b_s1k_v00.05
qwen-3b_s1k_v00.01
eval/loss
eval/loss
Select runs that logged eval/loss 
to visualize data in this line chart.
train/learning_rate
train/learning_rate
50100150200250300train/global_step0.0000020.0000040.0000060.0000080.00001
qwen-3b_s1k_v00.00
qwen-3b_s1k_v00.03
qwen-3b_s1k_v00.04
qwen-3b_s1k_v00.02
qwen-3b_s1k_v00.05
qwen-3b_s1k_v00.01
train/loss
train/loss
50100150200250300train/global_step0.811.2
qwen-3b_s1k_v00.00
qwen-3b_s1k_v00.03
qwen-3b_s1k_v00.04
qwen-3b_s1k_v00.02
qwen-3b_s1k_v00.05
qwen-3b_s1k_v00.01
 
OpenThoughts (Instruct)4
 
OpenThoughts (Base)6
s1k (Instruct)6
﻿
﻿

Add a comment