kastan

Kastan's group workspace

Group: Aug-05__13:58

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 3s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 16s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 13s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 33s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 14s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 10s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 26s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 17s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 14s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 26s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 37s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 26s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 17s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 33s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 10s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__13:58

BATCH_SIZE32

MICRO_BATCH_SIZE=4

NUM_EPOCHS=20

NUM_MICRO_BATCHES=8

PP=2

SLURM=513923

TP=4

WORLD_SIZE=16

3y ago

28m 19s

0.00015

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

titans.model.gpt.gpt.gpt2_medium

true

1024

50304

0.00015

0.01

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

1-16

of 16