我可以对产生 2 个不同最小 n 的不等大小组进行 t 检验功效分析吗?

机器算法验证 t检验 样本量 统计能力 幂律
2022-03-16 17:39:12

Power Analysis计算α 通常很简单minimum sample size,尤其是在我首选的统计计算环境R中。

但是,我被要求进行与我所做的任何事情或我可以在网上找到的参考资料略有不同的功率分析。我想知道我被要求的内容是否可能/有效。

该项目基本上有两种unequal groups状态,假设这两组在结果变量(即给客户打电话的持续时间)方面存在显着差异。“控制”组由 40 个州组成,产生了大约 2,500 个观测值。“测试”组有大约 10 个状态和 500 个观察值。

最初,我找到了 group means+ pooled standard deviation,我用它来计算Effect Size. 然后我使用了一个名为pwrin的包R,发现在给定 0.05 显着性和 0.8 功效的情况下,我需要每组大约 135 个观察值的最小样本量。

然而,他们拒绝了我的回答,因为他们希望一个群体比另一个群体像现在这样大得多,并且他们期望每组有两个不同的最小观察数量,或者就州数量而言,至少占人口的百分比或必须进入他们的“测试”组的观察。

我看到两个样本 t 检验(即 R 函数pwr.t2n.test)的 Power Analyses,但我必须指定至少一个样本量,而他们希望我告诉他们两组的最小样本量(作为数字或百分比),并且此函数不反映两组标准差的差异。

这是可能的还是我只是告诉他们这不是它的工作原理(即我能做的最好的事情就是告诉他们给定样本大小和汇总标准偏差,第二组必须至少有一定的大小)?

2个回答

您可以对不相等的样本量进行样本量计算。

例如,您可以确定 n 的比例(例如可能与人口的比例)。

然后可以进行功率计算(至少您可以模拟以获得任何特定情况下的功率,无论您是否能够进行代数)。

问题在于,与相同样本量的相同观察总数相比,它在发现差异方面效率相对较低。

想象一下,您有一个的总样本,总体方差相等且样本方差接近相等,并且您的选择是在 50-50 拆分和 90-10 拆分之间( vs )。n=n1+n2n1=0.5nn1=0.9n

两样本 t 统计量为:

t=X¯1X¯2spooled1n1+1n2

样本量的影响在术语中。1/1n1+1n2

如果你有 50-50 的分割,那就像有一个小 40% 的标准偏差;在给定的处,您可以通过偶数拆分获得明显更小的效果。n1+n2

如果组合样本量不是一个有效的约束条件,那么这种计算可能毫无意义。在每个观察都带有相同边际成本的情况下,这很重要,这并不总是相关的。

首先,您为什么假设两组的方差相等?请不要说“因为方便”。我严重怀疑组方差是否相等,尽管在样本量相等的情况下这并不重要。你的自由度会关闭,但你知道你至少有 130,所以谁在乎呢?还有更大的问题需要解决。

如果您要允许(或要求)不相等的组样本量,那么问题将没有唯一的解决方案。有两个未知数(并且只有一个约束(幂必须至少为。)我认为如果没有额外的约束就无法解决这个问题。有两种明显的可能性。第一种是修复一个样本量(例如,申办者希望从第一组中至少获得 300 个观察值)。另一个是固定比率(例如,因为第一组是第二组计数的十倍,我们希望) . 现在继续你的功率分析。n1n2ϕn1=10n2