如何测试线性模型中的斜率是否等于固定值?

机器算法验证 假设检验 回归
2022-03-25 06:25:50

假设我们有一个简单的线性回归模型,并希望针对一般替代方案Z=aX+bYH0:a=b=12

我认为可以使用的估计,并进一步应用周围的置信区间这个可以吗?a^SE(a^)Z12

另一个问题与这个问题密切相关。假设我们有一个样本并且我们计算统计量{(x1,y1,z1),,(xn,yn,zn)}χ2

i=1n(zixi+yi2)2xi+yi2.
这些统计数据可以用来检验相同的零假设吗?

2个回答

您可以使用完整与简化模型检验来检验此假设。这是你如何做到这一点的。首先,拟合模型并从该模型中获取残差。将残差平方并求和。这是完整模型的平方误差之和。我们称之为接下来,计算其中这些是您在零假设下的残差。将它们平方并总结。这是简化模型的平方误差之和。我们称之为Z=aX+bYSSEfZZ^Z^=1/2X+1/2YSSEr

现在计算:

F = ,((SSErSSEf)/2)/(SSEf/(n2))

其中是样本大小。下,此 F 统计量遵循具有自由度的 F 分布。nH02n2

这是使用 R 的示例:

x <- rnorm(n)
y <- rnorm(n)
z <- 1/2*x + 1/2*y + rnorm(n) ### note I am simulating under H0 here

res <- lm(z ~ x + y - 1)
summary(res)
SSE.f <- sum(resid(res)^2)

zhat  <- 1/2*x + 1/2*y
SSE.r <- sum((z-zhat)^2)

F <- ((SSE.r - SSE.f) / 2) / (SSE.f / (n-2))
pf(F, 2, n-2, lower.tail=FALSE) ### this is the p-value

如果 p 值低于 0.05(如果您的确实是 0.05),则拒绝 null。α

我假设你真的想让你的模型不包含拦截。换句话说,我假设您确实在使用模型而不是Z=aX+bYZ=c+aX+bY

在线性回归中,假设不是随机变量。因此,模型XY

Z=aX+bY+ϵ

在代数上与

Z12X12Y=(a12)X+(b12)Y+ϵ=αX+βY+ϵ.

这里,误差项不受影响。拟合这个模型,分别估计系数为,并以通常的方式检验假设α=a12β=b12ϵα^β^α=β=0


写在问题末尾的统计量不是卡方统计量,尽管它在形式上与卡方统计量相似。卡方统计量涉及计数,而不是数据值,并且其分母中必须有预期值,而不是协变量。一个或多个分母可能为零(或接近零),这表明该公式存在严重错误。如果这还不能令人信服,请考虑的测量单位可以是任何单位(例如德拉姆、秒差距和配克),因此像这样的线性组合(通常)是没有意义的。它不测试任何东西。xi+yi2ZXYzi(xi+yi)/2