refactor

Created on September 22|Last edited on September 22

Comment

﻿
﻿
objective/scores
objective/scores
5001k1.5kglobal_step012
exp_name: train_policy_accelerate, ppo.gradient_accumulation_steps: 1, base_model: gpt2   Run set
exp_name: train_policy_accelerate   Run set 2
objective/kl
objective/kl
5001k1.5kglobal_step0246810
system/gpu.0.gpu
system/gpu.0.gpu
20406080100Time (minutes)20406080
system/gpu.0.memoryAllocated
system/gpu.0.memoryAllocated
20406080100Time (minutes)1416182022
Run set5
Run set 24
﻿
﻿

Add a comment