如何计算相对风险的“确切置信区间”?

机器算法验证 置信区间 流行病学 相对风险
2022-03-17 21:25:47

我正在处理一些 MRSA 数据,需要计算一组医院与其余医院相比的相对风险。

我的同事给我一个excel,里面有一个公式来计算“相对风险的确切置信区间”,我可以毫无困难地进行计算,但我不知道如何以及为什么使用这个公式来进行这样的计算。

我已在此处附上 excel 文件供您参考。

谁能告诉我有关计算原理的参考?教科书上的文章对我来说很好。谢谢!

3个回答

查看 R EpiEpitools软件包,其中包括许多函数,用于计算流行病学研究中发现的各种关联测量的准确和近似 CIs/p 值,包括相对风险 (RR)。我知道还有PropCIs,但我从未尝试过。自举也是一种选择,但通常这些是流行病学论文中提供的精确或近似置信区间,尽管大多数解释性研究依赖于 GLM,因此使用优势比 (OR) 而不是 RR(尽管错误地它通常是解释的RR,因为它更容易理解,但这是另一回事)。

您还可以使用在线计算器检查您的结果,例如statpages.org相对风险和风险差异置信区间后者解释了如何完成计算。

“精确”检验通常是指不依赖于渐近分布的检验/CI,如卡方或标准正态分布;例如,在 RR 的情况下,95% CI 可以近似为 exp[log(rr)1.96Var(log(rr))],exp[log(rr)+1.96Var(log(rr))], 在哪里Var(log(rr))=1/a1/(a+b)+1/c1/(c+d)(假设有一个 2 路交叉分类表,其中a,b,c, 和d表示细胞频率)。但是,@Keith 给出的解释非常有见地。

有关流行病学中 CI 计算的更多详细信息,我建议查看罗斯曼和格陵兰的教科书,现代流行病学(现在是第 3 版) ,来自 Fleiss 等人的Statistical Methods for Rates and Proportions,或Statistical analysis of the相对风险,来自 JJ Gart (1979)。

正如@gd047 所指出的,您通常会得到与 相似的结果fisher.test(),尽管在这种情况下,此函数将为您提供 95% 的优势比 CI(在患病率较低的疾病的情况下,这将非常接近RR)。

笔记:

  1. 由于@csgillespie 提倡的原因,我没有检查您的 Excel 文件。
  2. Michael E Dewey 提供了一个有趣的风险比置信区间摘要,来自 R 邮件列表上的帖子摘要。

两个比例的比率没有单一的准确置信区间。一般而言,准确的 95% 置信区间是任何区间生成程序,它保证至少 95% 的真实比率覆盖率,而与基础比率的值无关。

由 Fisher 精确检验形成的区间可能过于保守——因为它对大多数参数值的覆盖率超过 95%。这没有错,但它也比它必须的更广泛。

StatXact 软件使用默认设置的区间在这里会是一个更好的选择——我相信它使用了一些不同的 Chan 区间(即使用 Berger-Boos 程序和标准化统计的极值搜索区间),但需要检查手册以确定。

当您询问“如何以及为什么”时 - 这是否回答了您的问题?我认为我们当然可以进一步阐述置信区间的定义以及如何从头开始构建置信区间,如果这是您正在寻找的。还是仅仅说这是一个基于 Fisher 精确检验的区间,它是无条件保证其覆盖率的置信区间之一(但不是唯一的,也不是最强大的)?

(脚注:一些作者保留“精确”一词仅适用于误报控制在精确 alpha 的区间和测试,而不仅仅是受 alpha 限制。从这个意义上说,根本不存在确定性的精确置信区间对于两个比例的比率,周期。所有确定性区间都必然是近似的。当然,即使如此,有些区间和测试确实可以无条件地控制 I 类错误,而有些则不能。)

这似乎是 Fisher 对计数数据的精确检验。您可以通过给出以下命令在 R 中重现结果:

data <- matrix(c(678,4450547,63,2509451),2,2)
fisher.test(data)

data:  data 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 4.682723 7.986867 
sample estimates:
odds ratio 
  6.068817