为什么似然比检验与费舍尔精确检验的 p 值不一致

机器算法验证 假设检验 似然比 渔民精确测试
2022-03-21 11:03:52

在分类数据的 2x2 分析中,是什么导致似然比检验的 p 值与 Fisher 精确检验和线性关联检验不同?或者,我可以去哪里学习这个?(我正在使用 SPSS。)例如,在一项分析中,Fisher 精确检验 2 边是 0.051,1 边是 0.027,似然比检验 p 是 0.031,线性关联 p 是 0.039 . 其中一些 p 值小于 0.05,还有一些小于 0.05。我信任哪一个,或者我如何从这些分析中选择?

1个回答

你这里有几个问题。首先,了解每个测试在做什么,然后解释 p 值。

首先,每个测试都有不同的基本假设。似然比检验统计量是通过取零模型下似然比的对数除以替代模型而形成的。检验统计量近似为卡方分布,并且渐近地等效于 Pearson 卡方检验。因为您正在使用渐近近似计算 p 值,所以您需要确保您有足够的数据来证明这样做是合理的。此外,该测试的关键假设之一是观察结果是独立的。

顾名思义,Fisher 精确检验根据基本假设计算精确的 p 值。随着样本量的增长,它不是使用连续分布作为近似值,而是基于离散分布。具体来说,观察任何 2x2 表的概率都遵循超几何分布。当没有足够的观察值来证明渐近检验的假设合理时,通常会使用此检验,尽管您可以将它用于任何给定数量的观察值(请参阅下面的编辑,我不再认为这是正确的)。然而重要的是,这个测试仍然假设独立。对于此检验和似然比检验,您的零假设是每个结果的概率相等。

线性关联模型正在测试不同的东西。这将对数优势比建模为每个变量的函数,以及解释变量之间关系的术语。您正在估计一个一般线性模型,假设计数的泊松分布与对数链接函数。我不熟悉 SPSS,但该测试的重要性可能表明您的观察不是独立的(因此违反了其他测试的假设)。(编辑:我认为您可以根据 SPSS 输出忽略此问题)。

最后,您似乎在解释 p 值时遇到了一些问题。可能值得考虑 p 值 0.051 与 0.049 之间的差异实际上意味着什么。你认为第一个在提供的证据方面与第二个有显着不同吗?您可能要调查的另一个问题是计算中间 p 值。这有助于解释基于离散分布的测试的一些保守性。例如,假设再观察一次会将您的 Fisher 精确 p 值从 0.051 更改为 0.025。这种 p 值的不连续性可以有效地使像 Fisher 精确检验这样的检验更加保守。对于所有这些主题的参考,我会推荐 Agresti 的分类数据分析。

编辑: 我将更深入地解决一些额外的问题。1) 为什么 p 值不同 2) 使用哪个测试

首先,这些测试的 p 值通常可能不同,因为它们使用不同的假设。为了说明,我为 2x2 表生成了一些随机样本数据。为此,我从 n = 10(每行 5 个数据点)开始,然后到 n = 1000。第 1 行的真实概率为 30%,第 2 行的真实概率为 70%。因为我们知道优势比确实不同,所以理想情况下我们应该看到较低的 p 值。下图显示了由 Fisher 检验估计的 p 值与 Pearson 卡方检验之间的差异(这对我来说比 LR 检验更容易快速运行以说明这一点)。

p值说明

请注意,特别是对于较小的 n,这些值可能会非常不同,尽管在应用连续性校正时它们的差异较小。

其次,您应该使用哪种测试?既然您已经在评论中发布了您的实际数据,我相信您应该使用 Fisher 检验。这是因为您有一个零单元格。然而,因为这个测试是保守的,你可能应该应用一个校正(我熟悉的是 mid-P 校正,不确定是否有其他更好的选择)。有关更多讨论和参考,请参阅下面的主题。鉴于作者提供的证据,该线程还使我重新考虑建议在任何情况下都可以使用费舍尔检验:

鉴于当今计算机的强大功能,是否有理由进行卡方检验而不是费舍尔的精确检验?

最后,该站点建议您可以忽略线性逐线性测试的问题。我没有详细介绍,但似乎它在 SPSS 中可能等同于卡方检验: https ://sites.google.com/a/lakeheadu.ca/bweaver/Home/statistics/notes /chisqr_assumptions