假设我有一个不平衡的数据集,我决定在模型训练期间对其进行过度/欠采样。然后,我想预测新记录,但使用类中原始的、真正的不平衡作为模型的先验。
即我的类以 1:100 的比例分布,我对 1:2 进行了欠采样,但希望模型知道 A 类非常罕见,因此在预测它时要小心。
对于逻辑回归,我熟悉截距校正的方法,在此处详述:
我的问题是:如果我使用深度学习而不是逻辑回归会怎样?我的推理是,由于NN的最后一层基本上是一个逻辑回归,我可以使用相同的方法来截取这一层。你能想到任何反对意见吗?有什么理由这没有意义吗?如果是这样,您将如何纠正模型?
另外,当我有两个以上的课程时,是否有一种通用的截距校正方法?