如果我只使用我的测试数据来训练模型,准确率会达到 100% 吗?

数据挖掘 预测建模 回归 过拟合
2022-02-19 17:32:53

虽然我知道如果我使用我测试的相同数据训练模型,那么我肯定会过度拟合,但该模型的准确率是否总是 100%?

换句话说,一种测试我是否正确创建模型的方法是通过在测试数据上训练模型来测试模型吗?

2个回答

即使有可能,它也可能不是 100%。但是,例如,线性模型可能无法表示数据中的非线性关系。或者您的功能不包含足够的信息来分隔所有类。

你的另一个问题似乎没有意义。如果你在测试数据上训练你的模型,测试数据就不再是测试数据了?!

有大量关于偏差方差权衡和过拟合的资源。

  • 仅仅因为你在训练集上进行训练,并不意味着你过度拟合了你的模型。事实上,你必须在你的训练集上训练,这是定义。如果您使用测试集进行训练,那么它不是测试集。
  • 避免过度拟合的常用方法是正则化。交叉验证是另一种可能性。还有很多很多其他的方法。
  • 在训练、验证和测试集中都可以达到 100% 的准确率。这取决于您的问题和模型的复杂性。