正态分布和随机森林
数据挖掘
scikit-学习
回归
随机森林
过拟合
分配
2022-01-26 11:20:19
1个回答
如果您使用随机森林等基于树的算法,则数据分布应该不是问题。线性算法更依赖于变量的分布。要检查您是否过拟合,可以尝试预测您的训练数据并将结果与测试数据进行比较。分数取决于您的评估指标。如果你使用scikit-learn
你得到 R^2 作为你的指标。
系数 R^2 定义为 (1 - u/v),其中 u 是残差平方和 ((y_true - y_pred) ** 2).sum(),v 是总平方和 ((y_true - y_true.mean()) ** 2).sum()。
其它你可能感兴趣的问题