在二进制分类练习中,我有一个数据集,其中 4519 个样本标记为“1”,18921 个样本标记为“0”。我很清楚,在分类算法(在本例中为随机森林)的训练阶段,应平衡 0/1 样本的数量,以防止算法偏向多数类。
但是,测试数据集也应该平衡吗?
换句话说,如果用 1000 个“0”类随机样本和 1000 个“1”类随机样本训练我的模型,我是否应该用剩余的 3519 个“1”类样本来测试模型,并随机选择另外 3519 个样本大多数“0”类,还是我可以选择剩余的 17921?
不平衡的测试数据集对精度、召回率和整体准确度指标有何影响?
谢谢