pszemraj

Pszemraj's workspace

Runs

Killed

Crashed

Finished

Failed

Finished

finetune

fp32

Crashed

finetune

fp32

killed bc same as sdp

Finished

finetune

fp32

Finished

finetune

fp32

Finished

finetune

fp32

Finished

finetune

Killed

finetune

Failed

finetune

Failed

Killed

Failed

finetune

Failed

finetune

Failed

finetune

Finished

finetune

Finished

finetune

7m 45s

NVIDIA RTX 6000 Ada Generation

TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

29889

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

30m 30s

Tesla T4

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.083333

steps

false

auto

false

[]

false

5m 13s

Tesla T4

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.083333

steps

false

auto

false

[]

false

20s

Tesla T4

./smol_llama-220M-GQA-local

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.083333

steps

true

auto

false

[]

false

3m 57s

Tesla T4

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.083333

steps

false

auto

false

[]

false

2m 51s

Tesla T4

BEE-spoke-data/smol_llama-101M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.125

steps

false

auto

false

[]

false

18m 30s

Tesla T4

BEE-spoke-data/smol_llama-101M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.125

steps

false

auto

false

[]

false

35m 59s

Tesla T4

BEE-spoke-data/smol_llama-101M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

0.125

steps

false

auto

false

[]

false

11m 32s

Tesla T4

BEE-spoke-data/smol_llama-101M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

true

0.125

steps

false

auto

false

[]

false

47m 59s

Tesla T4

BEE-spoke-data/smol_llama-101M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

false

true

1800

[]

false

true

false

true

0.083333

steps

false

auto

false

[]

false

2h 15m 19s

NVIDIA GeForce RTX 4090

pszemraj/tinyllama-1.1b-3T

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

25978

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

5m 45s

NVIDIA GeForce RTX 4090

pszemraj/tinyllama-1.1b-3T

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

15476

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

30m 11s

NVIDIA GeForce RTX 4090

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

7312

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

55m 10s

NVIDIA GeForce RTX 4090

BEE-spoke-data/llama-GQA-400m

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

28069

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

9m 51s

NVIDIA GeForce RTX 4090

BEE-spoke-data/llama-GQA-400m

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

3490

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

1h 1m 56s

NVIDIA GeForce RTX 4090

BEE-spoke-data/llama-GQA-400m

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

6992

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

10m 55s

NVIDIA GeForce RTX 4090

pszemraj/tinyllama-1.1b-3T

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

9661

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

7m 24s

NVIDIA GeForce RTX 4090

pszemraj/tinyllama-1.1b-3T

false

0.9

0.95

1.0000e-8

false

["LlamaForCausalLM"]

false

true

false

6306

false

true

1800

[]

false

true

false

true

false

steps

false

auto

false

[]

false

17m 8s

NVIDIA GeForce RTX 3090

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

true

false

true

false

1800

[]

false

true

false

true

0.083333

steps

false

auto

false

[]

false

1h 3m 54s

NVIDIA GeForce RTX 3090

BEE-spoke-data/smol_llama-220M-GQA

false

0.9

0.95

1.0000e-9

false

["LlamaForCausalLM"]

false

pharaouk/dharma-1/dharma_1_mini.json

2048

eval

true

false

true

false

1800

[]

false

true

false

true

0.083333

steps

false

auto

false

[]

false

1-20

of 34