Skip to main content

Annavettoruzzo's group workspace

Timestamps visible
2025-05-02 23:01:18
 [2025-05-02 19:01:18] iteration     5460/    5474 | consumed samples:      5591040 | elapsed time per iteration (ms): 1707.7 | throughput per GPU (TFLOP/s/GPU): 121.3 | learning rate: 3.483268E-05 | global batch size:  1024 | lm loss: 3.109079E+00 | load_balancing_loss: 1.006760E+00 | loss scale: 1.0 | grad norm: 0.093 | num zeros: 11596289.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-02 23:01:26
 [2025-05-02 19:01:26] iteration     5465/    5474 | consumed samples:      5596160 | elapsed time per iteration (ms): 1555.4 | throughput per GPU (TFLOP/s/GPU): 133.2 | learning rate: 3.309687E-05 | global batch size:  1024 | lm loss: 3.114429E+00 | load_balancing_loss: 1.007421E+00 | loss scale: 1.0 | grad norm: 0.088 | num zeros: 11002787.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-02 23:01:34
 [2025-05-02 19:01:34] iteration     5470/    5474 | consumed samples:      5601280 | elapsed time per iteration (ms): 1617.2 | throughput per GPU (TFLOP/s/GPU): 128.1 | learning rate: 3.137203E-05 | global batch size:  1024 | lm loss: 3.117014E+00 | load_balancing_loss: 1.005450E+00 | loss scale: 1.0 | grad norm: 0.086 | num zeros: 10491014.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-02 23:02:57
(min, max) time across ranks (ms):
2025-05-02 23:02:57
    evaluate .......................................: (69637.09, 69639.38)
2025-05-02 23:02:58
------------------------------------------------------------------------------------------------------------------
2025-05-02 23:02:58
 validation loss at iteration 5474 on validation set | lm loss value: 3.112581E+00 | lm loss PPL: 2.247900E+01 |
2025-05-02 23:02:58
------------------------------------------------------------------------------------------------------------------
2025-05-02 23:04:18
(min, max) time across ranks (ms):
2025-05-02 23:04:18
    evaluate .......................................: (80218.93, 80221.38)
2025-05-02 23:04:18
------------------------------------------------------------------------------------------------------------
2025-05-02 23:04:18
 validation loss at iteration 5474 on test set | lm loss value: 3.110072E+00 | lm loss PPL: 2.242266E+01 |
2025-05-02 23:04:18
------------------------------------------------------------------------------------------------------------