两样本比例比较,样本量估计:R vs Stata

机器算法验证 r 状态 样本量 统计能力 跳转
2022-03-18 20:04:02

两样本比例比较,样本量估计:R vs Stata

对于样本量,我得到了不同的结果,如下所示:

R中

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

结果:(所以 161)。n=160.7777

Stata中

sampsi 0.70 0.85, power(0.90) alpha(0.05)

结果:每组n=174

为什么有区别?谢谢。

顺便说一句,我在SAS JMP中运行了相同的样本量计算,结果:(几乎与 R 结果相同)。n=160

1个回答

不同之处在于 Stata 的sampsi命令(自 Stata 13 起已弃用并替换为power)默认使用连续性校正,而 Rpower.prop.test()不使用(有关 Stata 使用的公式的详细信息,请参阅[PSS] power twoproportions)。这可以通过nocontinuity选项进行更改,例如,

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

每组产生 161 个样本。使用连续性校正会产生更保守的测试(即更大的样本量),并且随着样本量的增加,显然影响较小。

Frank Harrell 在bpower(他的Hmisc包的一部分)的文档中指出,没有连续性校正的公式非常准确,从而为放弃校正提供了一些理由。