kastan

Kastan's group workspace

Group: Aug-05__12:37

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

12s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

39s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

20s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

36s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

11s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

13s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

39s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

40s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

40s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

39s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

20s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

38s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

11s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

38s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Failed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

12s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

Crashed

kastan

Aug-05__12:37

BATCH_SIZE16

MICRO_BATCH_SIZE=4

NUM_EPOCHS=3

NUM_MICRO_BATCHES=16

PP=2

SLURM=513717

TP=8

WORLD_SIZE=64

3y ago

12s

0.00015

./quant_gpt2_3d_tp8_bs16_lr0.00015/

1024

50304

0.01

col_ai_quant

/u/kastanday/LLM-Distributed-Quantization/datasets/small-gpt-dataset.json

AMP_TYPE.NAIVE

false

torch.float16

1024

50304

torch.float16

0.00015

0.01

titans.model.quant_gpt.quant_gpt.quant_gpt2_8B

titans.model.quant_gpt.quant_gpt.quant_gpt2_xl

titans.loss.lm_loss.gpt_lmloss.GPTLMLoss

1-20

of 64