帮助对小型数据集进行数据分析

机器算法验证 假设检验
2022-03-27 00:27:45

我有以下数据集(5个独立测量的三重值和一个控制的重复值):

Sample 1    Sample 2  Sample 3    Sample 4    Sample 5    C
181.8       58.2       288.9       273.2       290.9      53.9
120.3       116.8      108.9       281.3       446        39.6
86.1        148.5      52.9        126         150.3

这六种条件是在六种不同微生物中独立生产一种化学物质。

我的目的是找出样品 1-5 中的化学品产量是否显着高于 C(对照)。

起初,我进行了均值、SD 和 t 检验(单尾)。尽管 SD 误差条很大,但其中两个样本的平均值明显高于 C。

我决定进行中位数和 Wilcoxon-Mann-Whitney 检验,因为我担心我的数据量和重复数据的高度变化。然而,令我惊讶的是,中位数和 Wilcoxon-Mann-Whitney 检验并没有显示出统计学上显着的结果。

如果有人能建议我分析这个小数据集的最佳方法,我会很高兴。

3个回答

可以使用 ANOVA 的非参数版本:这称为Kruskal-Wallis检验。它基于对所有 17 个结果进行排名并计算每个组内的平均排名。对照组中 2.0 的平均排名明显小于任何其他平均排名(范围从 7 到 12)。但是,检验 p 值仅为 0.0937(基于卡方近似)。

在每组(包括对照组)中,SD 大约是平均值的一半(图中的“趋势”)。

SD 散点图与组平均值

这表明(并证明)基于浓度对数的分析,组 SD 将大致稳定。这为估计变化提供了 11 个自由度,因此每组只有两个或三个测量值不是限制。这种观察(使用对数可以稳定残差)本身就很重要,因为它表明了如何最好地进行估计,如何对这个实验的继续进行未来的分析,并支持控制标准偏差的看法三围确实比较小。(否则这是一个薄弱的结论,因为只有两个控制测量。)

日志对组标识符的回归(或等效的方差分析)具有 0.0521 的总体 p 值(使用具有 5 和 11 自由度的 F 检验)。这是暗示性的,但还不足以被大多数期刊视为“重要”。但是,这是一个双向测试,而您的假设是单向的。粗略的调整是将 p 值减半以反映这一点,并将结果报告为“显着”,p 大约等于 0.026。

因为这个粗略的调整只是一个近似值,你可以用一个置换测试来驱动这个点。回到非参数分析的想法,我们要求在所有 17 个结果与 17 个测量值随机相关的零假设下,控制测量的平均等级为 2.0或更低的机会。这相当于在 17 个中具有第一和第二或第一和第三最小浓度的对照。第一个事件的机会是和第二次事件的几率相同,总几率为(22)/(172)=1/1362/136,或 1.47%。您甚至可以保守地将结果描述为“所有对照浓度都在最低的三个中”。这种可能性是,等于 2.2%。无论如何,您有一个显着的结果(32)/(172)p<0.022

有时可以从样本到总体进行正式的统计推断,有时也可以简单地报告您的描述性结果并让您的听众做出非正式的推断——或不做,他们认为合适。这看起来像后者。使用两个控制值,您离没有任何发现所依据的变化只有一步之遥。

“然而,我很惊讶,中位数和 Wilcoxon-Mann-Whitney 检验并没有显示出统计学上显着的结果。” 我建议您熟悉有关统计功效的文献。

这是一个有趣的数据集。遵循@whuber 的建议并在对数尺度上进行分析似乎是个好主意。然而,这里有不止一个假设。因为你可以有假设

H0:samples 1-5 have the same mean and variance on the log scale,
and this is different from the control mean

但你也可以有:

H1:samples 1-3 have the same mean and variance on the log scale,
and this is different from the control mean, and samples 4-5 have
the same mean and variance but different from both control group
and samples 1-3

H1对我来说似乎是最合理的假设。您还可以拥有:

H2:samples 1-5 have different means and variances on the log
scale, and are different from the control group

这些假设中的每一个,如果为真,都将构成某种“重要”结果。无论如何,一旦你确定它们不同,兴趣就会转移到说“好吧,它们到底有什么不同?”

我认为您的结果不太重要,因为您正在测试具有许多参数H2

对于,我们的,显示出明显的差异,behrens Fisher 统计量为 H0mean±standard dev5.0±0.623.8±0.22

T=5.03.80.62215+0.2222=5.39

两个样本的 T 统计量约为,但数据不支持方差相等的假设,特别是因为对照组是迄今为止最低的方差,几乎是合并样本方差的三倍。2.64

更多稍后,因为我现在必须停下来......