torchtune_llama3 Table – Weights & Biases

Som's workspace

Runs

gpu_resources

loss

peak_memory_active

peak_memory_alloc

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

10s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

11s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

13s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

RyanSaleh/fdd

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

/teamspace/studios/this_studio/1.json

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

30s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

/teamspace/studios/this_studio/1.json

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3/

false

torchtune.datasets.instruct_dataset

512

/teamspace/studios/this_studio/1.json

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

/teamspace/studios/this_studio/1.json

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

/teamspace/studios/this_studio/1.json

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Killed

som

1y ago

31s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

28s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

30s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

10s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Failed

som

1y ago

34s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

Finished

som

1y ago

2h 42m 40s

torchtune.utils.FullModelMetaCheckpointer

/teamspace/studios/this_studio/llama3-8b-hf/original/

["consolidated.00.pth"]

LLAMA3

/teamspace/studios/this_studio/llama3-8b-hf/

false

torchtune.datasets.instruct_dataset

512

Someshfengde/AIMO_dataset

train

AlpacaInstructTemplate

true

cuda

bf16

true

torch.nn.CrossEntropyLoss

torchtune.modules.get_cosine_schedule_with_warmup

100

torchtune.utils.metric_logging.WandBLogger

torchtune_llama3

torchtune.models.llama3.lora_llama3_8b

false

["q_proj","v_proj"]

torch.optim.AdamW

0.0003

0.01

lora_finetune_output

torchtune.utils.profiler

false

true

torchtune.models.llama3.llama3_tokenizer

/teamspace/studios/this_studio/llama3-8b-hf/original/tokenizer.model

17055448064

0.76291

17.3223

1-19

of 19