参数样本量计算和非参数分析

机器算法验证 非参数 样本量
2022-03-10 08:13:17

我很想知道是否有人有特定的参考资料(文本或期刊文章)来支持医学文献中使用参数方法(即假设正态分布和一定的测量方差)执行样本量计算的常见做法何时使用非参数方法对主要试验结果进行分析。

一个例子:主要结果是给予某种药物后的呕吐时间,已知其平均值为 20 分钟(标准差为 6 分钟),但分布明显右偏。样本量计算是在上面列出的假设下完成的,使用公式

n(per-group)=f(α,β)×(2σ2/(μ1μ2)2) ,

其中根据所需的误差而变化。f(α,β)αβ

然而,由于分布的偏态,主要结果的分析将基于秩(非参数方法,例如 Mann Whitney U 检验)。

统计文献中的作者是否支持这种模式,或者是否应该进行非参数样本量估​​计(以及如何进行)?

我的想法是,为了方便计算,做上述练习是可以接受的。毕竟,样本量估计就是这样——已经做出了几个假设的估计——所有这些都可能有点(或非常!)不精确。但是,我很想知道其他人的想法,特别是想知道是否有任何参考资料可以支持这种推理。

非常感谢您的帮助。

2个回答

有些人似乎使用 Pitman 渐近相对效率 (ARE) 的概念来夸大通过使用样本量公式获得的样本量进行参数检验。具有讽刺意味的是,为了计算它,必须再次假设分布...参见例如Mann-Whitney U 检验的样本大小文章末尾的一些链接为进一步阅读提供了指导。

对我来说这听起来很狡猾。非参数方法几乎总是比参数方法涉及更多的自由度,因此需要更多的数据。在您的特定示例中,Mann-Whitney 检验的功效低于 t 检验,因此相同的指定功效和大小需要更多数据。

对任何方法(非参数或其他方法)进行样本量计算的简单方法是使用引导方法。