结合两个置信区间/点估计

机器算法验证 置信区间 荟萃分析
2022-02-13 18:04:21

假设一个人有两个来自同一总体的独立样本,并且对这两个样本使用了不同的方法来得出点估计和置信区间。在微不足道的情况下,明智的人只会合并两个样本并使用一种方法进行分析,但我们暂时假设由于其中一个样本的限制(例如缺失数据)而必须使用不同的方法。这两个单独的分析将为感兴趣的人口属性生成独立的、同样有效的估计。直觉上,我认为应该有一种方法可以正确地结合这两个估计,无论是在点估计还是置信区间方面,都会产生更好的估计过程。我的问题是最好的方法是什么?我可以根据每个样本中的信息/样本大小来想象某种加权平均值,但是置信区间呢?

4个回答

您可以按如下方式进行汇总估算。然后,您可以使用合并的估计值来生成组合置信区间。具体来说,让:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

使用这两种情况的置信区间,您可以重新构建估计的标准误差并将上述替换为:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

汇总估计为:

x¯=n1x1¯+n2x2¯n1+n2

因此,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)

对我来说听起来很像元分析您假设样本来自同一人群,这意味着您可以使用固定效应荟萃分析(而不是随机效应荟萃分析)。通用逆方差方法将一组独立的估计及其方差作为输入,因此不需要完整的数据并且即使对不同的样本使用了不同的估计量也可以工作。然后,组合估计是单独估计的加权平均值,通过其方差的倒数对每个估计进行加权。组合估计的方差是权重之和的倒数(方差的倒数)。

您希望在估计的抽样分布近似正态的尺度上工作,或者至少在置信区间近似对称的尺度上工作,因此对数变换尺度通常用于比率估计(风险比、优势比、比率比率...)。在其他情况下,方差稳定变换将很有用,例如泊松数据的平方根变换,二项式数据的反正弦平方根变换等。

这与分层样本没有什么不同。因此,为点估计和标准误差汇集样本似乎是一种合理的方法。这两个样本将按样本比例加权。

见论文:KM Scott, X. Lu, CM Cavanaugh, JS Liu,从不同形式的瑞利蒸馏方程估计动力学同位素效应的最佳方法,Geochimica et Cosmochimica Acta,第 68 卷,第 3 期,2004 年 2 月 1 日,第 433- 页442,ISSN 0016-7037,http: //dx.doi.org/10.1016/S0016-7037(03)00459-9 。http://www.sciencedirect.com/science/article/pii/S0016703703004599