假设我有一个-向量因变量,和-向量的自变量。什么时候是针对,我看到两者之间存在线性关系(上升趋势)。现在,这也意味着两者之间存在线性下降趋势和.
现在,如果我运行回归: 并得到拟合值
然后我运行回归:并得到拟合值
将两个预测值,和大致相等?
假设我有一个-向量因变量,和-向量的自变量。什么时候是针对,我看到两者之间存在线性关系(上升趋势)。现在,这也意味着两者之间存在线性下降趋势和.
现在,如果我运行回归: 并得到拟合值
然后我运行回归:并得到拟合值
将两个预测值,和大致相等?
当 Y 被绘制在,我看到两者之间存在线性关系(上升趋势)。现在,这也意味着 Y 和 X 之间存在线性下降趋势
最后一句话错了:有下降趋势,但绝不是线性的:
我用了一个作为功能加上一点噪音. 如您所见,在绘图时反对产生线性行为,反对远非线性。
(@whuber 指出反对情节看起来不是同调的。我认为它似乎有较低的方差因为更高的案例密度导致更大的范围,这基本上是我们所感知的。实际上,数据是同方差的:我曾经Y = 1 / X + rnorm (length (X), sd = 0.1)
生成数据,所以不依赖于大小.)
所以总的来说,这种关系是非常非线性的。也就是说,除非你的范围太窄了,你可以近似这是一个例子:
底线:
我认为他们没有理由“大致相等”——但你所说的大致相等到底是什么意思?
这是一个玩具示例:
library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method="lm", formula=y ~ 0 + x) + # Blue, OP's y hat
geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red")) # Red, OP's y tilde
p
图片:
如果允许“蓝色”模型有一个截距(即常数)项,它会做得更好......