哪种类型的回归对于外推较小的值具有最佳预测能力?

数据挖掘 机器学习 预测建模 回归 scikit-学习
2022-03-12 17:33:17

我有一个数据集,它以 10 -20的顺序处理响应变量这种回归的散点图看起来是线性的,但问题是当我使用与训练样本相比非常小的值预测测试用例时,预测的响应变量出现在负值中。请注意,预测的数据集的值不应为负。

这是我的数据的 3d 散点图 在此处输入图像描述

是否有一种回归类型具有更好的预测能力,可以执行此类操作而不会出现此类错误?

1个回答

好的,所以您应用线性回归为您的数据创建模型,当您使用该模型预测新值时,输出值不满足约束(即为正)。我只能想到这里可能发生的一些不同的事情:

  • 您为模型提供的新输入值不在问题的允许范围内。考虑到您的设置,这不太可能 - 大概您对自己的情况非常了解以确定允许哪些输入值 - 但如果确实是这种情况,您需要更改获取输入的方式。
  • 线性模型在原始输入数据和新输入数据之间的整个范围内并不准确。如果没有更多的领域知识,就不可能判断哪种模型是更好的替代品。如果在这种情况下,您可以提出某种关于应该以何种一般形式的模型来描述数据的理论预测,那么您应该使用该形式。如果不是...尝试指数我猜?
  • 线性模型是准确的,只是不是这个特定的模型。例如,您可能必须执行一些操作,例如强制回归包含特定点(例如原点)。这意味着您实际上并没有进行完整的线性回归,而是使用更少的自由参数来拟合模型 - 例如,在斜率截距形式中,您基本上将截距强制为零并且仅拟合斜率。或者如果使用另一个点,则等效。这应该可以通过您可以使用的一些回归库来实现。但是如果你使用线性模型,它会在某处预测负值。您必须忍受将参数空间的这些区域声明为模型域之外(或者可能找到一种方法来理解负值)。

根据您在此处提供的少量信息,我真的无话可说。也许如果您更详细地描述您的情况,我可以提供更具体的建议。