OR(优势比)的分布是什么?

机器算法验证 分布 优势比
2022-01-25 08:06:52

我有一堆文章介绍了“或”,CI 为 95%(置信区间)。

我想从文章中估计观察到的 OR 的 P 值。为此,我需要一个关于 OR 分布的假设。我可以安全地假设/使用什么发行版?

4个回答

估计量 的渐近正态分布然而,除非很大,否则它们的分布是高度偏斜的。例如,不能比小很多(因为),但它可能会大得多,概率不可忽略。具有加法而不是乘法结构的对数变换可以更快地收敛到正态性。估计方差为: 的置信区间OR^ORnOR=1OR^OROR^0

Var[lnOR^]=(1n11)+(1n12)+(1n21)+(1n22).
lnOR : 对其端点求幂(取反对数)为提供了置信区间.
ln(OR^)±zα2σln(OR)
OR

阿格雷斯蒂,艾伦。分类数据分析,第 70 页。

对数优势比具有正态渐近分布:

log(OR^)N(log(OR),σlog(OR)2)

从列联表估计。例如,参见注释的第 6 页:σ

通常,对于大样本量,假定所有估计量(或它们的一些机会函数)具有正态分布是合理的近似值。因此,如果您只需要与给定置信区间对应的p值,您可以简单地进行如下操作:

  1. 和对应的 CI 转换为 [域是域是 ]OR(c1,c2)ln(OR)(ln(c1),ln(c2))
    OR(0,+)ln(OR)(,+)
  2. 由于每个 CI 的长度取决于其水平 alpha 和估计量标准差,因此计算

    d(OR)=ln(c2)ln(c1)zα/22
    [Pr(Z>zα/2)=α/2;z0.05/2=1.96]

  3. 计算对应于(标准化正态)检验统计量的p值z=ln(OR)sd(OR)

由于优势比不能为负,所以它被限制在低端,而不是在高端,因此具有偏态分布。