Skip to main content

Annavettoruzzo's group workspace

Timestamps visible
2025-05-14 20:03:45
 [2025-05-14 16:03:45] iteration     5785/    5796 | consumed samples:      5923840 | elapsed time per iteration (ms): 1128.1 | throughput per GPU (TFLOP/s/GPU): 285.9 | learning rate: 3.357904E-05 | global batch size:  1024 | lm loss: 3.142389E+00 | loss scale: 1.0 | grad norm: 0.097 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-14 20:03:50
 [2025-05-14 16:03:50] iteration     5790/    5796 | consumed samples:      5928960 | elapsed time per iteration (ms): 1075.9 | throughput per GPU (TFLOP/s/GPU): 299.8 | learning rate: 3.194636E-05 | global batch size:  1024 | lm loss: 3.158917E+00 | loss scale: 1.0 | grad norm: 0.099 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-14 20:03:56
 [2025-05-14 16:03:56] iteration     5795/    5796 | consumed samples:      5934080 | elapsed time per iteration (ms): 1038.1 | throughput per GPU (TFLOP/s/GPU): 310.7 | learning rate: 3.032342E-05 | global batch size:  1024 | lm loss: 3.137992E+00 | loss scale: 1.0 | grad norm: 0.102 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-14 20:04:47
(min, max) time across ranks (ms):
2025-05-14 20:04:47
    evaluate .......................................: (47872.37, 47872.86)
2025-05-14 20:04:47
------------------------------------------------------------------------------------------------------------------
2025-05-14 20:04:47
 validation loss at iteration 5796 on validation set | lm loss value: 3.149340E+00 | lm loss PPL: 2.332067E+01 |
2025-05-14 20:04:47
------------------------------------------------------------------------------------------------------------------
2025-05-14 20:05:45
(min, max) time across ranks (ms):
2025-05-14 20:05:45
    evaluate .......................................: (58733.31, 58734.58)
2025-05-14 20:05:45
------------------------------------------------------------------------------------------------------------
2025-05-14 20:05:45
 validation loss at iteration 5796 on test set | lm loss value: 3.147702E+00 | lm loss PPL: 2.328250E+01 |
2025-05-14 20:05:45
------------------------------------------------------------------------------------------------------------