R中的Xgboost:处理极端的类不平衡
数据挖掘
r
xgboost
2022-02-22 23:12:29
2个回答
如果您的测试集在模型开发中受到适当的阻碍,那么从 64 下降到 50 似乎并没有过度拟合。(从混淆矩阵来看,您似乎没有犯过在拆分之前进行上采样的相当常见的错误。)
如果“完全不同的测试数据”与训练数据的分布不同,则可以解释这种差异。没有普遍的好方法来解释 iid 数据假设的失败。您可以尝试对模型进行更多的欠拟合,假设有一些潜在的大趋势在数据集中是恒定的,并且模型在训练/验证集中发现(并过度拟合)一些额外的、更本地化的趋势。
在应用 XGboost 之前尝试使用 SMOTE。
其它你可能感兴趣的问题
