F检验的样本量公式?

机器算法验证 样本量 统计能力 非中心 f检验
2022-03-27 10:59:21

我想知道是否有适用于 F 检验的样本量公式,例如 Lehr 公式?Lehr 的 t 检验公式为n=16/Δ2, 在哪里Δ是效果大小(例如 Δ=(μ1μ2)/σ)。这可以概括为n=c/Δ2在哪里c是一个常数,它取决于 I 类速率、所需的功率以及是执行单侧测试还是双侧测试。

我正在寻找类似的 F 检验公式。在另一种情况下,我的测试统计量作为非中心 F 分布k,n自由度和非中心参数nλ, 在哪里λ仅取决于总体参数,这些参数未知但假定具有一定的价值。参数k由实验确定,并且n是样本量。理想情况下,我正在寻找形式的(最好是众所周知的)公式

n=cg(k,λ)
在哪里c仅取决于 I 型速率和功率。

样本量应满足

F(F1(1α;k,n,0);k,n,nλ)=β,
在哪里F(x;k,n,δ)是非中心 F 的 CDFk,n自由度和非中心性参数δ, 和α,β是 I 型和 II 型利率。我们可以假设kn n需要“足够大”。

我在 R 中摆弄这个的尝试并没有取得成果。我见过g(k,λ)=λ/k+1建议但合身看起来不太好。

编辑:最初我含糊地说非中心性参数“取决于”样本量。再想一想,我觉得这太混乱了,所以把关系说清楚了。

另外,我可以计算n正是通过求根器(例如布伦特方法)求解隐式方程。我正在寻找一个方程式来指导我的直觉并用作经验法则​​。

1个回答

我想知道是否有适用于 F 检验的样本量公式,例如 Lehr 公式?

“流行病学家的强大工具”网页解释说:

  • 两种方法之间的差异(Lehr):

    例如,假设您想证明两组之间的智商差异为 10 分,其中一组暴露于潜在的毒素中,而另一组则没有。使用 100 的平均人口智商和 20 的标准差:

    ngroup=16(10090/20)2

    ngroup=16(.5)2=64

  • 均值变化百分比

    临床研究人员可能更愿意考虑百分比变化而不是平均值和可变性的差异。例如,有人可能对具有大约 30% 变异性的数据中两组之间 20% 的差异感兴趣。van Belle 教授对这类数字提出了一种巧妙的方法,该方法使用变异系数 (cv) 4 并将百分比变化转换为均值比率。

    对数尺度上的方差(参见 van Belle 的第 5 章)大约等于原始尺度上的变异系数,因此 Lehr 的公式可以翻译成使用 cv 的版本

    ngroup=16(c.v.)2(ln(μ0)ln(μ1))2

    然后我们可以使用百分比变化作为均值的比率,其中

    r.m.=μ0μ1μ0=1μ1μ0

    制定一个经验法则:

    ngroup=16(c.v.)2(ln(r.m.))2

    在上面的示例中,20% 的变化转化为 1−.20=.80 的均值比率。(5% 的变化将导致均值比率为 1−.05=.95;35% 的变化为 1−.35=.65,依此类推。)均值变化 20%,数据在均值周围变化约 30% 将是

    ngroup=16(.3)2(ln(.8))2=29

An R function based on this rule would be:

1   nPC<-function(cv, pc){
2       x<-16*(cv)^2/((log((1-pc)))^2)
3       print(x)
4   }

Say you were interested in a 15% change from one group to another, but were uncertain about how the data varied. You could look at a range of values for the coefficient of variation:

1   a<-c(.05,.10,.15,.20,.30,.40,.50,.75,1)
2   nPC(a,.15)

You could use this to graphically display your results:

1   plot(a,nPC(a,.15),  ylab="Number in Each Group", 
2   xlab="By Varying Coefficent of Variation", 
3   main="Sample Size Estimate for a 15% Difference")

另请参阅:iSixSigma“如何确定样本量”和 RaoSoft“在线样本量计算器”。