如何计算优势比的标准误差?

机器算法验证 荟萃分析 遗传学
2022-03-01 10:37:13

我有两个来自全基因组关联研究的数据集。唯一可用的信息是第一个数据集的优势比和 p 值。对于第二个数据集,我有优势比、p 值和等位基因频率(AFD= 疾病,AFC= 对照)(例如:0.321)。我正在尝试对这些数据进行荟萃分析,但我没有效果大小参数来执行此操作。是否有可能仅使用提供的信息计算每个数据的 SE 和 OR 置信区间?
先感谢您

示例:可用数据:

    Study     SNP ID      P        OR    Allele   AFD    AFC
    1         rs12345    0.023    0.85
    2         rs12345    0.014    0.91     C      0.32   0.25

有了这些数据,我可以计算 SE 和 CI95% OR 吗?谢谢

1个回答

您可以通过 p 值计算/近似标准误差。首先,通过将两侧 p 值除以 2 将它们转换为一侧 p 值。所以你得到然后将这些 p 值转换为相应的 z 值。对于,这是,对于,这是(它们是负数,因为优势比低于 1)。这些 z 值实际上是通过取比值比的对数除以相应的标准误差(即)计算得出的检验统计量。因此,得出p=.0115p=.007p=.0115z=2.273p=.007z=2.457z=log(OR)/SESE=log(OR)/zSE=0.071第一项研究和SE=.038

现在你有一切可以进行荟萃分析了。我将说明如何使用 metafor 包使用 R 进行计算:

library(metafor)
yi  <- log(c(.85, .91))     ### the log odds ratios
sei <- c(0.071, .038)       ### the corresponding standard errors
res <- rma(yi=yi, sei=sei)  ### fit a random-effects model to these data
res

Random-Effects Model (k = 2; tau^2 estimator: REML)

tau^2 (estimate of total amount of heterogeneity): 0 (SE = 0.0046)
tau (sqrt of the estimate of total heterogeneity): 0
I^2 (% of total variability due to heterogeneity): 0.00%
H^2 (total variability / within-study variance):   1.00

Test for Heterogeneity: 
Q(df = 1) = 0.7174, p-val = 0.3970

Model Results:

estimate       se     zval     pval    ci.lb    ci.ub          
 -0.1095   0.0335  -3.2683   0.0011  -0.1752  -0.0438       ** 

请注意,荟萃分析是使用对数优势比完成的。因此,是基于这两项研究的估计汇总对数优势比。让我们将其转换回优势比:0.1095

predict(res, transf=exp, digits=2)

 pred  se ci.lb ci.ub cr.lb cr.ub
 0.90  NA  0.84  0.96  0.84  0.96

因此,综合优势比为 0.90,95% CI:0.84 至 0.96。