在我将我的数据集乘以m次后,我想计算二项式比例置信区间。在考虑鲁宾斯规则的同时,我如何结合置信区间的各种估计?
多重插补后如何组合/合并二项式置信区间?
机器算法验证
置信区间
二项分布
多重插补
老鼠
2022-03-26 04:49:02
1个回答
这确实是一个有趣的问题。问题在于,基于比例中心极限定理的标准误差通常是不可取的,因为比例是一个计算量,因此在抽样中表现出倾斜的不确定性。如您所提到的,威尔逊分数通过估计与标准比例不同的数量来绕过偏度. 您需要使用 Rubin 的规则是对这个转换比例的插补内方差的估计,这只是在单个数据集上估计的方差/标准误差,以及每个数据集的转换比例本身。
所以对于 Wilson 得分区间,首先需要计算转换后的估计值 然后分别方差,从你的公式是
这将为您提供每个转换参数的估计值和转换参数的方差数据集。
然后,您可以使用一些可用的 R 工具组合这些估计,例如mi.meld来自Amelia或mice您提到的或 R 包mitools。然后,一旦有了转换后的参数,就可以根据新导出的方差/参数估计值计算置信区间。
如果这些 R 包提供转换后的估计值而不仅仅是置信区间,这将更容易,但您可能可以从相关的 R 代码中挖掘它们。
其它你可能感兴趣的问题