BigBird base NER fine-tuning results

A comparison of training results for the Feedback Prize competition

Created on December 19|Last edited on December 21

Comment

﻿
﻿
Training comparison

parameterbb-basebb-base-idpt
model namegoogle/bigbird-roberta-basegoogle/bigbird-roberta-base
in-domain pre-trainingNoYes
learning rate2e-52e-5
weight decay0.00950.0095
train batch size44
gradient accumulation steps88
fp16TrueTrue
seed1818
﻿
﻿
﻿
eval/loss
eval/loss
10203040Step0.650.70.750.80.850.9
eval/CV F1
eval/CV F1
10203040Step00.10.20.30.40.5
train/loss
train/loss
010203040Step0.511.522.5
﻿
﻿

parameter	bb-base	bb-base-idpt
model name	google/bigbird-roberta-base	google/bigbird-roberta-base
in-domain pre-training	No	Yes
learning rate	2e-5	2e-5
weight decay	0.0095	0.0095
train batch size	4	4
gradient accumulation steps	8	8
fp16	True	True
seed	18	18

Add a comment