我正在训练一个(深度)神经网络来分类大约 60 个不同的类别。数据集中每个类的出现范围很广,从最多表示到最少表示 3 个数量级。神经网络目前从不预测 20 个最少代表类别中的任何一个。
除了按班级加权之外,还有其他方法可以缓解这种情况,例如增加辍学率或其他方法吗?这可以在网络结构中得到缓解吗?如果按类别加权是唯一的选择,那么将类别加权与发生频率成反比的最佳方案是什么?
我正在训练一个(深度)神经网络来分类大约 60 个不同的类别。数据集中每个类的出现范围很广,从最多表示到最少表示 3 个数量级。神经网络目前从不预测 20 个最少代表类别中的任何一个。
除了按班级加权之外,还有其他方法可以缓解这种情况,例如增加辍学率或其他方法吗?这可以在网络结构中得到缓解吗?如果按类别加权是唯一的选择,那么将类别加权与发生频率成反比的最佳方案是什么?