Gao Haitao - Machine Learning Portfolio in Weights & Biases

Skip to main content

Reports

LLama3.2-1B Posting Training By GRPO from DeepSeek

Model link: https://huggingface.co/accuracy-maker/Llama-3.2-1B-GRPO-gsm8k Wandb link: https://wandb.ai/accuracy-maker/Llama3.2-1B-GRPO?nw=nwuseraccuracymaker

Last edit 5 months ago

Activity

Mon

Wed

Fri

Sep

Oct

Nov

Dec

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Runs

Llama-3.2-1B-GRPO-gsm8k-2

Llama3.2-1B-GRPO

Crashed

6 months ago

Llama-3.2-1B-GRPO-gsm8k

Llama3.2-1B-GRPO

Finished

6 months ago

Loading...