如何检查更大的训练数据集是否会提高我的 scikit 分类器的准确性,有什么方法吗?
如何检查更大的训练数据集是否会提高我的 scikit 分类器的准确性?
数据挖掘
分类
scikit-学习
准确性
2022-02-21 13:22:58
2个回答
一个想法:
- 将您的数据拆分为训练/保留数据集。
- 在一小部分训练数据(比如 50%)上训练模型并在保留数据集上进行测试。
- 在较大部分的训练数据(比如 75%)上训练模型并在保留数据集上进行测试。
使用相同的保留数据进行测试非常重要,这样您就可以执行真正的准确性测试。
由于您正在进行分类,因此您应该检查您的数据是否平衡,如果不平衡则进行调整(这也可以提高您的准确性,而无需更大的训练数据)。
其它你可能感兴趣的问题

