Wald p 值在哪里?在混合模型的 resulf 中,LRT 值在哪里?

机器算法验证 混合模式 回归系数 固定效应模型 似然比 沃尔德测试
2022-04-12 04:13:51

我读到,有很多方法可以确定自由度,从而计算混合模型中固定效应的 p 值。我读到,最差的是 Wald 检验,而对数似然检验要好一些。这么多名字。我有点迷路了。

  1. 因此,当我得到混合模型的输出时,在任何统计包中,我都会得到带有 p 值的系数列表。他们是沃尔德的吗?

  2. 当我对这样的模型输出进行方差分析时,它会对属于单个效应的所有系数进行联合测试,因此,方差分析给我一个一个主效应的 p 值。在某些包中,如 R 或 SAS,可以选择:LRT、Kenward-Roger、Satthertwhite、F 测试、Chi2 测试。沃尔德是哪一个?这是Chi2测试吗?LRT 是 F 测试吗?Kenward-Roger 是对 Wald 的“小数据调整”吗?

  3. 简而言之 - 其中哪些(Wald、t 检验、F 检验、Chi2 检验、LRT)指的是模型系数,哪些指的是主效应?如果有的话,哪一个可以指这两者?

示例:固定部分系数的软件无关报告:

Intercept      Estimate   SE    t or z  P-value    <- are these Wald, right, not LRT?
Coeff 1        Estimate   SE    t or z  p-value
Coeff 2        Estimate   SE    t or z  p-value
Interactions   Estimate   SE    t or z  p-value

etc.

模型上的 ANOVA 与软件无关的报告,以获得主要效果:

Main Effect 1    Estimate  SE   some_statistic  some_p_value  <- are these F/LRT? Chi2/Wald? (corrected with KR, for example)
Main Effect 2    Estimate  SE   some_statistic  some_p_value
Interaction      Estimate  SE   some_statistic  some_p_value
1个回答

1. 因此,当我得到混合模型的输出时,在任何统计包中,我都会得到带有 p 值的系数列表。他们是沃尔德的吗?

是的,通常它们是。它们可能是 -statistics/tests(即,假设样本足够大,因此标准误差没有不确定性)或 -statistics(由于样本量有限,允许 std err 中的不确定性);这通常在列名中表示(以及在输出中出现“df”或“ddf”[(分母)自由度]列)。Zt

在您的第二种情况下(“ANOVA”的结果),如果不阅读文档,很难确切知道正在进行哪些测试。它可能是 Wald 或 LRT,并且可能会进行某种有限大小的校正(请参阅 #2 下的详细信息)。

  1. 当我对这样的模型输出进行方差分析时,它会对属于单个效应的所有系数进行联合测试,因此,方差分析给我一个一个主效应的 p 值。在某些包中,如 R 或 SAS,可以选择:LRT、Kenward-Roger、[Sattherthwaite]、F 测试、Chi2 测试。沃尔德是哪一个?这是Chi2测试吗?LRT 是 F 测试吗?Kenward-Roger 是对 Wald 的“小数据调整”吗?

这有点复杂。

  • Wald 检验通常假设对数似然曲面是二次的。
    • 他们可能会忽略数据集的有限性,特别是与令人讨厌的参数相关的不确定性,例如残差标准差(在这种情况下,它们是“Wald 卡方检验”,因为检验统计量是(或按比例缩放 ) 在这种情况下分布χ2χ2
    • 如果它们考虑到数据集的有限性,它们就是“F 检验”(分布检验统计量) F
      • 如果实验设计是平衡和嵌套的,则可以精确计算 F 统计量的分母自由度 (df)
      • 如果不是,则必须使用诸如 Satterthwaite 或 Kenward-Roger 之类的近似值(因此您的问题“KR 是对 Wald 的‘小数据调整’吗?”的答案是“是”)
  • 似然比检验(也称为“LRT”(也)“Chi2”,因为 LRT 的检验统计量是 -distributed:在 R 中,如果输出仅显示“Chi2”而不是“Wald Chi2”它可能是 LRT)考虑了对数似然面的非二次形状,但考虑由于有限大小而导致的有害参数的不确定性。LRT 的有限尺寸校正很复杂,很少使用。χ2
  1. 简而言之 - 其中哪些(Wald、t 检验、F 检验、Chi2 检验、LRT)指的是模型系数,哪些指的是主效应?如果有的话,哪一个可以指这两者?

我猜你所说的“系数”是指单个系数的测试(例如回归模型中的斜率)与同时等于零的多个系数的联合测试(例如具有> 2个级别的分类预测器的影响)。t 检验和 Z 检验专门指单个系数。F 和 Chi2 本质上是检验比例系数的平方和,因此可以参考单系数或多系数检验。Wald 和 LRT 指的是关于对数似然面形状的假设,因此并不特定于单系数或多系数检验。

另请参阅:关于分母 df 的 GLMM 常见问题解答lme4的“pvalue”帮助页面如何在线性混合效应模型(lmer vs glmer)中获得 z 值而不是 t 值?

欢迎指正和评论。