是否可以在给定 95% 置信区间的情况下从优势比中恢复 2x2 表的原始数量?

机器算法验证 r 优势比
2022-03-28 16:16:38

优势比通常是从 2x2 表中计算出来的,并且看起来对于 2x2 表中的每个数字组合(或数字比)具有非常独特的结果统计和置信区间值组合。

是否可以在给定 95% 置信区间的情况下从优势比中恢复 2x2 表的原始数量?

即:OR=2.252;95% CI = 0.932 -- 5.439

是否有可能从这些数据中获得观察次数?

是否可以通过给定的观察总数恢复原始数字?

即上述情况为133

PS原表:

                positive    negative
exposed         14          39
not exposed     11          69

可以在R中做到吗?

1个回答

简短回答不,不同的边距可以产生相同的奇数比和置信区间。一些例子。


这是一个关于如何找到表格的最小可能 N 的简短草图。请注意,根据您的链接站点,标准错误可以通过以下方式与单元格内容相关:

SE=1a+1b+1c+1d

忽略实际优势比,该值在时最小化。这将产生关系:a=b=c=d

SE2=1n/4+1n/4+1n/4+1n/4=4n/4=16n

因此,随后我们可以将表的最小可能 N 估计为在您的示例中,标准误差可以通过 95% 置信区间恢复:16/SE2

[log(High)log(Low)]/[21.96]

刚刚超过,因此在该标准误差下,表的最小可能 N 是(取该值的上限)。0.4516/0.452=80


这种逻辑虽然无助于找到最大值。假设表格的一行具有非常大的值。因此 (,所以我们只有:cd1/c+1/d)0

SE2=1a+1b

假设,所以要获得 2.25 的优势比,我们只需要所以对于这个例子,所以所以下表:c/d=4/9a=bSE2=2/aa10

                positive    negative
exposed         10          10
not exposed     4e6         9e6

产生 2.25 的奇数比和 0.9365 到 5.4058 的 95% CI。


最后,即使您有表格的总 N,标准误差也存在对称性,您可以简单地交换行总计并重新计算单元格以具有相同的奇数比率。在许多情况下,这将产生大致相同的标准误差。

所以我们可以重写你原来的表:

                positive    negative
exposed         14          39
not exposed     11          69

作为:

                positive    negative
exposed         23          57
not exposed      8          45

这产生了 2.2697 的优势比和 0.9280 到 5.5516 的 95% 置信区间。不完全相同,但在某种程度上,这种识别取决于报告中的四舍五入量,所以我会犹豫是否依赖它,并且随着行总数的增加,找到确切的 N 会越来越困难。

如果你知道 N,你总是可以做一个网格搜索,但我不相信它总是会产生一个唯一的解决方案。


我什至忘记了最明显的对称性,你可以简单地翻转表格对角线上的数字,仍然可以获得完全相同的优势比和标准误差。例如

                positive    negative
exposed         69          11
not exposed     39          14

结果与原始表相同的汇总统计信息。