akhauriyash

Akhauriyash's workspace

Runs

do_wikitext_eval

late_context_upweight

no_wikitext_eval

Head Hit Acc

Head Hit Corr

Crashed

akhauriyash

7mo ago

19m 1s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

false

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.2-3B

false

0.001

TrainTokenButler

false

L3_3B_2k_CausalLoss.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_3B_2k_CausalLoss

Killed

akhauriyash

8mo ago

20h 7m 3s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.1-8B

/home/ya255/projects/TokenButler/checkpoints/TrainTokenButler_42_finetune_None_None_500_llama_meta-llama_Llama-3.1-8B_L3_8B_1k.csv_L3_8B_1k_Cont_False_False_2000_False_redpajama_1024_1_1_20_0.001_1024/4_False_False_True_32_0.3875000000000002.pt

false

0.001

TrainTokenButler

false

L3_8B_1k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_8B_1k_Cont2

Finished

akhauriyash

8mo ago

18h 45m 6s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-2-7b-hf

/home/ya255/projects/TokenButler/checkpoints/TrainTokenButler_42_finetune_None_None_500_llama_meta-llama_Llama-2-7b-hf_L2_7B_2k.csv_L2_7B_2k_False_False_2000_False_redpajama_1024_1_1_20_0.001_1024/4_False_False_True_32_0.3875000000000002.pt

false

0.001

TrainTokenButler

false

L2_7B_2k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L2_7B_2k_Cont

Finished

akhauriyash

8mo ago

34m 7s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

deepseek-ai/DeepSeek-R1-Distill-Llama-8B

/home/ya255/projects/TokenButler/checkpoints/TrainTokenButler_42_finetune_None_None_500_llama_deepseek-ai_DeepSeek-R1-Distill-Llama-8B_L3_8B_R1_1K.csv_L3_8B_R1_1K_False_False_2000_False_redpajama_1024_1_1_20_0.001_1024/4_False_False_True_32_0.3875000000000002.pt

false

0.001

TrainTokenButler

false

L3_8B_R1_1K.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_8B_R1_1K_Cont

Finished

akhauriyash

8mo ago

1h 59m 54s

mistral

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

mistralai/Mistral-7B-v0.1

/home/ya255/projects/TokenButler/checkpoints/TrainTokenButler_42_finetune_None_None_500_mistral_mistralai_Mistral-7B-v0.1_M7B_1k.csv_M7B_1k_False_False_2000_False_redpajama_1024_1_1_20_0.001_1024/4_False_False_True_32_0.3875000000000002.pt

false

0.001

TrainTokenButler

false

M7B_1k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

M7B_1k_Cont

Killed

akhauriyash

8mo ago

6h 3m 36s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.1-8B

/home/ya255/projects/TokenButler/checkpoints/TrainTokenButler_42_finetune_None_None_500_llama_meta-llama_Llama-3.1-8B_L3_8B_1k.csv_L3_8B_1k_False_False_2000_False_redpajama_1024_1_1_20_0.001_1024/4_False_False_True_32_0.3875000000000002.pt

false

0.001

TrainTokenButler

false

L3_8B_1k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_8B_1k_Cont

Finished

akhauriyash

8mo ago

17h 3m 56s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

512

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.2-1B

false

0.001

TrainTokenButler

false

L3_1B_2k.csv

500

["winogrande","triviaqa"]

false

fixed_40pc

false

1024

L3_1B_2k

Killed

akhauriyash

8mo ago

1d 22h 22m 49s

mistral

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

mistralai/Mistral-7B-v0.1

false

0.001

TrainTokenButler

false

M7B_1k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

M7B_1k

Finished

akhauriyash

8mo ago

1d 15h 11m 27s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.1-8B

false

0.001

TrainTokenButler

false

L3_8B_1k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_8B_1k

Killed

akhauriyash

8mo ago

1d 22h 23m 11s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-2-7b-hf

false

0.001

TrainTokenButler

false

L2_7B_2k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L2_7B_2k

Finished

akhauriyash

8mo ago

1d 1h 14m 31s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

meta-llama/Llama-3.2-3B

false

0.001

TrainTokenButler

false

L3_3B_2k.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_3B_2k

Killed

akhauriyash

8mo ago

1d 22h 23m 28s

llama

false

true

false

true

ExpPred

1000

1024

2000

redpajama

false

1024

["triviaqa","qasper","trec","samsum","lcc","repobench-p","qmsum","multi_news"]

finetune

false

deepseek-ai/DeepSeek-R1-Distill-Llama-8B

false

0.001

TrainTokenButler

false

L3_8B_R1_1K.csv

500

["winogrande","hellaswag","piqa","arc_easy"]

false

fixed_40pc

false

1024

L3_8B_R1_1K

1-12

of 12