Skip to main content

Annavettoruzzo's group workspace

Timestamps visible
2025-05-09 08:45:18
 [2025-05-09 04:45:18] iteration    13240/   13252 | consumed samples:     13557760 | elapsed time per iteration (ms): 1647.7 | throughput per GPU (TFLOP/s/GPU): 342.9 | learning rate: 3.170027E-05 | global batch size:  1024 | lm loss: 2.823173E+00 | loss scale: 1.0 | grad norm: 0.069 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-09 08:45:26
 [2025-05-09 04:45:26] iteration    13245/   13252 | consumed samples:     13562880 | elapsed time per iteration (ms): 1536.1 | throughput per GPU (TFLOP/s/GPU): 367.8 | learning rate: 3.099053E-05 | global batch size:  1024 | lm loss: 2.835510E+00 | loss scale: 1.0 | grad norm: 0.067 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-09 08:45:33
 [2025-05-09 04:45:33] iteration    13250/   13252 | consumed samples:     13568000 | elapsed time per iteration (ms): 1576.8 | throughput per GPU (TFLOP/s/GPU): 358.3 | learning rate: 3.028264E-05 | global batch size:  1024 | lm loss: 2.835784E+00 | loss scale: 1.0 | grad norm: 0.066 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-09 08:46:26
(min, max) time across ranks (ms):
2025-05-09 08:46:26
    evaluate .......................................: (45985.61, 45986.58)
2025-05-09 08:46:26
-------------------------------------------------------------------------------------------------------------------
2025-05-09 08:46:26
 validation loss at iteration 13252 on validation set | lm loss value: 2.837936E+00 | lm loss PPL: 1.708048E+01 |
2025-05-09 08:46:26
-------------------------------------------------------------------------------------------------------------------
2025-05-09 08:47:14
(min, max) time across ranks (ms):
2025-05-09 08:47:14
    evaluate .......................................: (48042.98, 48044.12)
2025-05-09 08:47:14
-------------------------------------------------------------------------------------------------------------
2025-05-09 08:47:14
 validation loss at iteration 13252 on test set | lm loss value: 2.831685E+00 | lm loss PPL: 1.697404E+01 |
2025-05-09 08:47:14
-------------------------------------------------------------------------------------------------------------