可折叠性:优势比与风险比

机器算法验证 可能性 流行病学
2022-03-30 10:23:57

众所周知,优势比具有一定的对称性。例如,结果的优势比的倒数另一方面,风险比率不喜欢这种对称性。但是,风险比率具有可折叠性。因此,调整不是混杂因素的协变量不会改变风险比的大小。考虑可折叠性的更正式定义:Y¬Y

定义是任何函数,它测量联合分布如果上是可折叠的g[P(x,y)]YXP(x,y)gZ

Ezg[P(x,y|z)]=g[P(x,y)]

那么在风险比的情况下,会是风险比吗?如果我们不知道怎么办?风险比是两个发病密度的比率,似乎不依赖于任何概率分布。g[P(x,y)]P(x,y)

2个回答

是和不是。风险比是可折叠的,因此调整与暴露或结果无关的任何变量不应改变风险比的大小。此外,各层的汇总风险比应介于特定层风险比的值之间(与优势比不符)。

但是,在调整了技术上不是混杂因素的变量后,有很多方法可以使风险比产生偏差。例如,调整中间值会导致偏差,尽管可折叠,因为一些关联将被删除。此外,调整暴露和结果的共同影响将导致风险比的偏差——这有时被称为对撞机偏差或选择偏差。最后,在某些情况下,调整仅与结果相关的变量可以改变风险比的大小——在这种情况下,风险比在技术上没有偏差,它只是估计一个不同的数量(暴露对人们结果的影响)这些第三变量具有一定的分布)。

就您为可折叠性给出的正式定义而言,我对此并不完全熟悉,但我相信 g(P(x,y)) 是风险比是正确的。此外,我的理解是,风险比(更重要的是风险比的方差和置信区间)是在每个风险都遵循独立的二项分布的假设下计算的。

众所周知,风险比 (RR) 是可折叠的。因此,如果所有 z 的 RR(|z)<1,那么对于 z 的任何分布,E(RR(|)<1。让我们考虑最初的 Simpson 例子

       x  0 1        x    0  1            x   0  1
z=0: Y=0: 5 8   z=1:Y=0: 15 12   Total: Y=0: 20 20 
     Y=1  3 4       Y=1  3  2           Y=1   6  6. 

那么RR(Y=1|z=0) = (4/12)/(3/8) = 8/9, RR(Y=1|z=1) = (2/14)/(3/18) = 6/7 边际 RR(Y=1) = (6/26)/(6/26) = 1 如果 RR 是可折叠的怎么办?

此外,RR 不是严格可折叠的,即 RR(|z) 在 z 上可能是常数,但与边际 RR 不同。例子

       x  0 1        x    0  1            x   0  1
z=0: Y=0: 3 2   z=1:Y=0:  2  5   Total: Y=0:  5  7 
     Y=1  7 1       Y=1   3  2          Y=1: 10  3. 

那么RR(Y=1|z=0) = (1/3)/(7/10) = 10/21, RR(Y=1|z=1) = (2/7)/(3/5) = 10/21 边际 RR(Y=1) = (3/10)/(10/15) = 9/20

伊利亚·诺维科夫