残差与拟合图上的平行直线

机器算法验证 r 回归 多重回归
2022-03-21 22:07:30

我有一个多元回归问题,我尝试使用简单的多元回归来解决:

model1 <- lm(Y ~ X1 + X2 + X3 + X4 + X5, data=data)

这似乎解释了 85% 的方差(根据 R 平方),这似乎相当不错。

然而让我担心的是看起来怪异的残差与拟合图,见下文:

在此处输入图像描述

我怀疑我们有这样的平行线的原因是因为 Y 值只有 10 个唯一值对应于大约 160 个 X 值。

在这种情况下,也许我应该使用不同类型的回归?

编辑:我在下面的论文中看到了类似的行为。请注意,它只有一页纸,因此当您预览它时,您可以阅读全部内容。我认为它很好地解释了为什么我观察到这种行为,但我仍然不确定是否有任何其他回归会在这里更好地工作?

Edit2:我能想到的最接近我们案例的例子是利率的变化。美联储每隔几个月宣布一次新利率(我们不知道何时以及多久一次)。与此同时,我们每天收集我们的自变量(例如每日通货膨胀率、股市数据等)。结果,我们将遇到一种情况,我们可以对一个利率进行多次测量。

1个回答

一种可能的模型是“舍入”或“审查”变量之一:让y1,y10是你的 10 个观察值。可以假设存在一个潜在变量Z代表您不完全了解的“真实”价格。但是,你可以写Yi=yjyj1Ziyj+1(和y0=,y11=+,如果你原谅这种符号的滥用)。如果您愿意冒险对每个区间中 Z 的分布进行陈述,贝叶斯回归就变得微不足道;最大似然估计需要更多的工作(但据我所知并不多)。Gelman & Hill (2007) 处理了这个问题的类似问题。