是否有统计检验来比较大小为 1 和 3 的两个样本?

机器算法验证 假设检验 t检验 样本量
2022-02-02 03:09:34

对于一个生态项目,我的实验室组将醋添加到 4 个装有等量池塘水的水箱中,1 个没有伊乐藻(一种水生植物)的对照和 3 次处理,每个水箱中都有相同数量的伊乐藻。添加醋的目的是降低 pH 值。假设是装有伊乐藻的水箱会更快地恢复到正常的 pH 值。情况确实如此。我们每天测量每个罐的 pH 值大约两周。所有的水箱最终都恢复到了它们的自然 pH 值,但是对于伊乐藻水箱来说,所需的时间要短得多。

当我们告诉我们的教授我们的实验设计时,他说不存在可以对数据执行的统计检验来比较对照与治疗。那是因为对照没有重复(我们只使用一个对照罐),我们无法计算方差,因此我们无法比较对照和处理的样本均值。所以我的问题是,这是真的吗?我绝对明白他的意思。例如,如果你测量了一男一女的身高,你就无法对他们各自的人口得出结论。但我们做了 3 次处理,差异很小。假设控制中的方差相似,这似乎是合理的?

更新:

感谢您的出色回答。我们从湿地中获得了更多的水和伊乐藻,并决定用更小的水箱再次进行实验,但这次有 5 个对照和 5 个处理。我们将把它与我们的原始数据结合起来,但水箱的起始 pH 值差异很大,以至于认为新实验从与原始实验相同的人群中取样似乎是无效的。

我们考虑添加不同数量的伊乐藻,并尝试将 pH 修复的速度(以 pH 恢复到其原始值的时间测量)与伊乐藻的量相关联,但我们认为这没有必要。我们的目标只是表明伊乐藻产生了积极的影响,而不是构建某种预测模型来准确预测 pH 值如何响应不同数量的伊乐藻。确定伊乐藻的最佳数量会很有趣,但这可能只是可以存活的最大数量。尝试将回归曲线拟合到数据不会特别有启发性,因为在添加大量数据时社区会发生各种复杂的变化。伊乐藻死亡,分解,新的生物开始占据主导地位,等等。

1个回答

注意gung的问题;这很重要。我将假设治疗组中每个坦克的治疗都是相同的。

如果您可以争辩两组的方差相等(无论如何您通常会假设两个样本 t 检验),您可以进行测试。你只是无法检查这个假设,无论它可能被严重违反。

在对相关问题的回答中表达的担忧与您的情况更为相关,但您对此无能为力。

[您询问假设方差相等是否合理。我们无法为您回答这个问题,您必须说服主题专家(即生态学家)这是一个合理的假设。是否有其他研究在治疗和控制下测量了这种水平?其他类似测试(尤其是 t-tests 或 anova - 我敢打赌你可以找到更好的先例)已经完成或做出类似假设?您可以看到某种形式的一般推理适用?]

如果x¯是处理的样本均值,并且y¯是控制的平均值,两者都来自具有方差的正态分布σ2, 然后 x¯y¯会有意思μxμy和方差σ2(1/nx+1/ny)无论是否其中之一n是 1。

所以当ny是 1,

(x¯y¯)sx1/nx+1

(在哪里sx是从治疗计算的标准偏差)将是t-分布式(与nx1自由度)在零下。

您可能会注意到,根据最佳可用估计σ,sx用于sp,这与普通的两样本 t 检验公式完全相同ny设置为 1。

编辑:

这是此测试的模拟功率曲线。零点处的样本量为 10000,其他点为 1000。如您所见,零点处的拒绝率为 0.05,而功效曲线虽然需要较大的总体均值差异才能具有不错的功效,但具有正确的形状。也就是说,这个测试做了它应该做的事情。

功率曲线

(结束编辑)

然而,由于样本量如此之小,这将对分布假设有些敏感。

如果您准备做出不同的假设,或者想要测试一些其他人口数量的相等性,那么一些测试可能仍然是可能的。

所以一切都没有丢失......但在可能的情况下,通常最好在两组中至少进行一些复制。