我SimpleTranformers
用来训练和评估模型。
由于我使用的数据集严重不平衡,因此建议我为每个标签分配权重。这里SimpleTranformers
给出了一个分配权重的例子。
然而,我的问题是:我该如何为每个班级选择合适的权重?是否有特定的方法,例如使用标签比率的公式?
后续问题:用于同一数据集的权重是否“通用”?即,如果我使用完全不同的模型,我可以使用相同的权重还是应该根据模型分配不同的权重。
ps1。如果有任何区别,我正在使用roBERTa
.
ps2。这里有一个类似的问题,但是,我相信我的问题不是重复的,因为 a)附加的问题是关于 Keras,而我的问题是关于变形金刚的,并且 b)我也在询问关于权重值如何的一般建议决定所附问题不在哪里。