Skip to main content

Annavettoruzzo's group workspace

Timestamps visible
2025-05-06 08:47:01
 [2025-05-06 04:47:01] iteration     5460/    5473 | consumed samples:      5591040 | elapsed time per iteration (ms): 1054.8 | throughput per GPU (TFLOP/s/GPU): 98.2 | learning rate: 3.448464E-05 | global batch size:  1024 | lm loss: 3.080871E+00 | z_loss: 3.164300E-02 | load_balancing_loss: 1.007992E+00 | loss scale: 1.0 | grad norm: 0.103 | num zeros: 11657224.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-06 08:47:07
 [2025-05-06 04:47:07] iteration     5465/    5473 | consumed samples:      5596160 | elapsed time per iteration (ms): 1150.8 | throughput per GPU (TFLOP/s/GPU): 90.0 | learning rate: 3.275103E-05 | global batch size:  1024 | lm loss: 3.078132E+00 | z_loss: 3.214141E-02 | load_balancing_loss: 1.008805E+00 | loss scale: 1.0 | grad norm: 0.092 | num zeros: 11069972.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-06 08:47:13
 [2025-05-06 04:47:13] iteration     5470/    5473 | consumed samples:      5601280 | elapsed time per iteration (ms): 1350.0 | throughput per GPU (TFLOP/s/GPU): 76.7 | learning rate: 3.102837E-05 | global batch size:  1024 | lm loss: 3.084656E+00 | z_loss: 3.136131E-02 | load_balancing_loss: 1.007703E+00 | loss scale: 1.0 | grad norm: 0.094 | num zeros: 10854288.0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-06 08:47:59
(min, max) time across ranks (ms):
2025-05-06 08:47:59
    evaluate .......................................: (34558.70, 34560.84)
2025-05-06 08:47:59
------------------------------------------------------------------------------------------------------------------
2025-05-06 08:47:59
 validation loss at iteration 5473 on validation set | lm loss value: 3.080763E+00 | lm loss PPL: 2.177500E+01 |
2025-05-06 08:47:59
------------------------------------------------------------------------------------------------------------------
2025-05-06 08:48:39
(min, max) time across ranks (ms):
2025-05-06 08:48:39
    evaluate .......................................: (39661.40, 39663.17)
2025-05-06 08:48:39
------------------------------------------------------------------------------------------------------------
2025-05-06 08:48:39
 validation loss at iteration 5473 on test set | lm loss value: 3.077473E+00 | lm loss PPL: 2.170350E+01 |
2025-05-06 08:48:39
------------------------------------------------------------------------------------------------------------