回归中的 Wald 检验(OLS 和 GLM):t 分布与 z 分布

机器算法验证 r 回归 假设检验 广义线性模型
2022-02-06 07:41:31

我了解回归系数的 Wald 检验基于以下渐近成立的属性(例如 Wasserman (2006):All of Statistics,第 153、214-215 页):

(β^β0)se^(β^)N(0,1)
在哪里β^表示估计的回归系数,se^(β^)表示回归系数的标准误差和β0是感兴趣的价值(β0通常为 0 来检验系数是否与 0 显着不同)。所以尺寸αWald测试是:拒绝H0什么时候|W|>zα/2在哪里
W=β^se^(β^).

lm但是当你在 R 中执行线性回归时,一个t-value 而不是 az-value 用于测试回归系数是否显着不同于 0(带有summary.lm)。此外,glm在 R 中的输出有时会给出z- 而有时t-值作为测试统计。显然,z- 值用于假设分散参数已知且t估计色散参数时使用 -values(请参阅此链接)。

有人可以解释一下,为什么t- 分布有时用于 Wald 检验,即使假设系数与其标准误差的比率按标准正态分布?

回答问题后编辑

这篇文章还为这个问题提供了有用的信息。

2个回答

glm使用泊松分布的输出给出了z-值,因为对于泊松分布,均值和方差参数是相同的。在泊松模型中,您只需估计一个参数 (λ)。glm你必须估计均值离散参数的地方,你应该看到t-使用的分布。

对于标准线性回归,您假设误差项是正态分布的。在这里,必须估计方差参数 - 因此使用t-检验统计量的分布。如果您以某种方式知道误差项的总体方差,则可以使用z-test 统计数据。

正如您在帖子中提到的,测试的分布是渐近正态的。t-分布是渐近正态的,因此在大样本中,差异可以忽略不计。

在 GLM 框架中,通常,您提到的W检验统计量是渐近 正态分布的,这就是您在 R 中看到z值的原因。

除此之外,在处理线性模型时,即具有正态分布响应变量的 GLM,检验统计量的分布学生的 t,所以在R中你有t值。