我在 SPSS 27 中运行各种多元回归分析,对于那些没有自举的分析,p 值会发生变化,以至于我在回归中找不到两次相同的 p 值(例如,p 值将是 0.000012435 、0.0053868、0.000000013845 等)。但是,我引导了其中一些回归(bca,500 个样本),并且表下列出的所有 p 值表明引导结果是 0.001996 的倍数(例如,0.001996、0.003992、0.007984)。这些是合法的 p 值吗?或者这是 SPSS 的一个错误?无论哪种情况,这些 p 值是“可报告的”,还是应该使用非自举回归结果的 p 值?
自举回归分析后,所有 p 值都是 0.001996 的倍数
机器算法验证
回归
p 值
spss
引导程序
2022-01-25 22:05:32
1个回答
假设您的回归系数估计值为 1.2。要计算其 p 值,您需要知道在原假设下观察到如此大(或更大)的系数的概率。为此,您必须知道该系数的零分布。自举重采样是估计这种零分布的一种方法。对于回归,在您的 500 个引导样本中,您将获得回归系数的分布,其均值接近 1.2。假设自举采样系数的平均值为 1.19。假设您的零假设是系数的真实值为 0。这意味着该系数的零分布的平均值应为 0。我们可以通过简单地使 500 个自举采样系数的平均值为 0减去他们当前的平均值 1.19。
然后,要计算(双尾)p 值,我们可以简单地计算 500 个偏移系数的绝对值大于观测值 1.2 的比例。例如,如果其中 6 个更大,则 p 值为 6/500 = 0.012。请注意,我们以这种方式计算的任何 p 值将始终是某个整数除以 500。因此,可以从该计算得出的唯一 p 值是 0.002 的整数倍的值,即 1/500。
你得到的值不是 0.002 的倍数,而是 0.001996 的倍数。结果几乎完全等于 1/501。这种差异为 1 的原因是,从 bootstrap 计算的“常规”p 值存在偏差。常规公式是, 在哪里是大于观察值的自举采样系数的数量,以及是引导样本的数量。偏差校正公式为. 因此,由该公式得出的任何 p 值都将是,在你的情况下是 1/501。
其它你可能感兴趣的问题