1 路方差分析的最小样本量?

机器算法验证 方差分析 样本量 事后
2022-03-07 12:12:50

我已经在不同的时间点测试了一组参与者,我想调查每个后续时间点的平均分数是否与基线的平均分数有显着差异(例如,第 0 天与第 1 天的分数,第 0 天与第 0 天的分数2等)。我的计划是执行重复测量单向方差分析和 Dunnett 事后检验,以比较当天的平均分数与基线日分数。但是,该组的 n 数是 6。单向方差分析是否适用于像这样的低 n 数?单向方差分析是否有最小样本量?如果是这样,是否有更好的替代统计数据可供使用?

3个回答

下面描述了三种估计完全随机设计的样本量的方法。请注意,这些程序在您必须提供的信息方面有所不同。

方法#1(需要大部分信息)

要计算样本量,研究人员首先需要指定:

1)显着性水平,α(α)

2) 功率,1-β

3) 总体方差的大小,σ2

4) 总体治疗效果的平方和。

在实践中,3 和 4 是未知的。但是,您可以从试点螺柱估计两者。或者,您可以从以前的研究中估计这些参数。

例如,假设我们进行了一项试点研究并估计了总体方差和总体治疗效果的平方和。如果我们让 α = 0.05 和 1-β = 0.80,那么我们可以使用试错法来计算所需的样本量。您计算的检验统计量是 phi (Φ),其中:

Φ = (n^0.5)[(治疗效果平方的平均值/总体方差)],其中 n 是样本量值。然后,可以使用 Φ 检验统计量来查找与 Tang 图表中的样本量相对应的功效(引用如下)。

方法#2

如果无法从试点研究或先前的研究中获得 #3 和 #4 的准确估计值,则可以使用另一种方法,该方法需要大致了解最大和最小总体平均值之间的差异相对于标准偏差的大小总体标准差:

μmax - μmin = d σ,其中d是总体标准差的倍数。换句话说,如果您想检测最高和最小均值之间的差异(等于弹出的某个乘数),则此方法允许您计算样本量。标准偏差(无论是二分之一,还是 1.5 或其他任何值)。有关此方法的数学计算,请参阅 Kirk (2013) [我有一个 PDF]。

方法 3

如果您对方法 1 中的 #3 和 #4 一无所知,并且无法将 μmax - μmin 表示为 pop 的倍数。标准差,那么您可以使用关联强度或效应大小来计算样本量。这种方法还要求研究人员指定显着性水平 α 以及功效 1 - β。

请记住,关联的强度表示因变量中总体方差由自变量解释的比例。欧米茄平方用于测量具有固定治疗效果的方差分析中的关联强度,而组内相关性用于分析具有随机治疗效果的方差。

根据 Cohen (1988),我们知道(对于关联强度):

ω^2 = 0.010 是一个小关联

ω^2 = 0.059 是中等关联

ω^2 = 0.138 或更大是大关联

对于效果大小:

f = 0.10 是一个小的效应大小

f = 0.25 是中等效应大小

f = 0.40 或更大是一个大效应量。

回到方法 3:如果我们有一个具有p处理水平的完全随机设计,那么我们可以计算检测任何关联强度大小或任何影响大小大小所需的样本量(数学是等效的)。同样,如果您有兴趣为这种方法计算数学,我建议您参考 Kirk (2013)。

科恩,J. (1988)。行为科学的统计功效分析(第 2 版)。新泽西州希尔斯代尔:劳伦斯·厄尔鲍姆

柯克,RE(2013)实验设计:行为科学程序

唐,PC 方差分析检验的幂函数及其使用的表格和插图。统计学家。水库 回忆录。1938,2, 126–149。

单向方差分析 F 检验的绝对最小可能样本量将比组数大一。您的问题尚不清楚,但听起来您每组有 6 个。

(不建议使用这么少,但在这种情况下可以进行方差分析,并且在假设成立时仍然可以使理论起作用——尽管您无法检查它们。)

如果我正确理解了 Dunnett 的程序,那么最小值将是相同的,因为它的 pariwise 比较似乎基于相同的常见估计σ作为方差分析。

在非常小的样本量下,最大的担忧将是非常低的功效和在非常低的样本量下对正态性假设的比通常更高的敏感性;如果您指定功效,则可以为此计算最小样本量;同样,我无法真正确定您可以承受的从敏感性到非正态性的影响(在显着性水平或功效上)有多大。

ANOVA 没有最小样本量,但您可能会遇到统计功效问题,即您拒绝虚假零假设的能力。如果基线和其他度量之间的效应大小差异不够大,您可能无法拒绝零。如果您拒绝 Null,则无需担心。如果您没有拒绝但您认为存在有意义的差异,请尝试收集更多数据以增加您的统计能力。如果您无法收集更多数据并且想知道更多数据是否会产生影响,请复制并粘贴您的数据,从而使其大小翻倍,然后重新运行分析。如果结果显着,那么您知道问题是由于样本量小而导致的低功效。然后,您可以报告如果您有更多病例,您的结果会很重要,但不要报告人为地将样本量加倍得到的结果——这不合适。