Skip to main content

Annavettoruzzo's group workspace

Timestamps visible
2025-05-08 02:09:55
 [2025-05-07 22:09:55] iteration     3850/    3864 | consumed samples:      3942400 | elapsed time per iteration (ms): 1021.6 | throughput per GPU (TFLOP/s/GPU): 315.7 | learning rate: 3.687386E-05 | global batch size:  1024 | lm loss: 3.204133E+00 | loss scale: 1.0 | grad norm: 0.110 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-08 02:10:00
 [2025-05-07 22:10:00] iteration     3855/    3864 | consumed samples:      3947520 | elapsed time per iteration (ms): 1018.6 | throughput per GPU (TFLOP/s/GPU): 316.6 | learning rate: 3.439905E-05 | global batch size:  1024 | lm loss: 3.195640E+00 | loss scale: 1.0 | grad norm: 0.113 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-08 02:10:06
 [2025-05-07 22:10:06] iteration     3860/    3864 | consumed samples:      3952640 | elapsed time per iteration (ms): 1062.9 | throughput per GPU (TFLOP/s/GPU): 303.5 | learning rate: 3.194636E-05 | global batch size:  1024 | lm loss: 3.209478E+00 | loss scale: 1.0 | grad norm: 0.107 | num zeros: 0 | number of skipped iterations:   0 | number of nan iterations:   0 |
2025-05-08 02:11:03
(min, max) time across ranks (ms):
2025-05-08 02:11:03
    evaluate .......................................: (45577.87, 45578.12)
2025-05-08 02:11:03
------------------------------------------------------------------------------------------------------------------
2025-05-08 02:11:03
 validation loss at iteration 3864 on validation set | lm loss value: 3.202141E+00 | lm loss PPL: 2.458511E+01 |
2025-05-08 02:11:03
------------------------------------------------------------------------------------------------------------------
2025-05-08 02:11:59
(min, max) time across ranks (ms):
2025-05-08 02:11:59
    evaluate .......................................: (55168.05, 55168.94)
2025-05-08 02:11:59
------------------------------------------------------------------------------------------------------------
2025-05-08 02:11:59
 validation loss at iteration 3864 on test set | lm loss value: 3.200584E+00 | lm loss PPL: 2.454687E+01 |
2025-05-08 02:11:59
------------------------------------------------------------------------------------------------------------