一些统计软件在报告回归系数时使用 Wald 统计量。例如,R 和 Stata 默认报告 Wald。
维基百科上的逻辑回归文章说,不幸的是没有参考:
“而不是 Wald 方法,计算逻辑回归 p 值的推荐方法是似然比检验 (LRT)”
Wald 和 LRT 如何计算逻辑回归系数(自变量)?这是为了提醒您如何计算它们并突出它们的差异。
来自维基百科上的 Wald 测试页面:
- [T]Wald 检验对于重新参数化不是不变的,而无论我们使用 R、log R 还是 R 的任何其他单调变换,似然比检验都会给出完全相同的答案。
因此,在逻辑回归的上下文中,如果您记录了一个回归量,其 p 值与未记录的情况相比会有所不同(这是正确的)。如果使用 LRT,p 值会改变吗?
从同一个 Wald 测试页面:
- 另一个原因是 Wald 检验使用两个近似值(我们知道标准误差,并且分布是 χ2),而似然比检验使用一个近似值(分布是 χ2)。
虽然 Wald 和似然比是渐近等价的,但在逻辑回归中,我们通常处于渐近线前设置,因此这不是将其视为等价的理由。
因此,Wald 检验的劣势似乎超过了逻辑设置中的优势,并且似然比更好。
我猜逻辑回归软件例程使用 Wald 检验是因为它更容易计算效率,这在过去首次创建 R 和 Stata 等软件时更为重要。然后,通过向后兼容并且不想改变其逻辑函数的语义,Wald 统计量仍然是默认值。有任何证据证明情况如此吗?
我应该更改默认的 Wald 与似然比吗?一个较小的问题,在 R 中是否容易做到这一点?