所有流行的评估指标(ROC-AUC、混淆矩阵等)都需要两个列表作为参数:与任意一组训练示例 ( x's ) 相关联的实际y标签列表,以及预测标签的并行列表由模型赋予那些x。
要构建此类列表,您必须将测试/验证数据集与您提供模型的训练集分开。但是,随机森林会自动划分您给它的训练集的 1/3 以计算袋外得分。我不相信你可以阻止导致这种情况的装袋过程,因为我认为这对随机森林的运作方式至关重要。因为 RF 模型永远不会看到 1/3 的训练集(由于 bagging),所以 RF 是否会创建一个不太彻底的数据集图像,例如,每当为评估保留测试集时,神经网络就会创建?