不能用 t 检验比较样本量为 3 的组吗?

机器算法验证 t检验 小样本
2022-04-10 02:14:16

我想知道 t 检验是否可以用于非常小的样本量。我有一组数据,每组只有 3 个条目,我需要比较两组是否有显着差异。

1个回答

置换测试将功率不足。(没有足够的不同方法将六个样本分成两组,每组三个。) 但是如果t 检验的假设成立,那么它的结果是有效的。

许多有思想的读者会质疑这种情况是否真的会出现。 让我分享一个真实的故事。 它涉及清理田地中的铅污染:多年来,一位农民接受了“回收”电池并将它们倾倒在他的房子后面。最终,环境监管机构追上了他。他们让“责任方”经历了三个阶段的清理工作:(1)对土壤进行抽样,估计铅污染的数量和程度;(2) 去除薄层土壤,在此过程中取样,直到明显达到清洁土壤;(3) 独立取样所有剩余土壤,正式测试平均铅浓度是否低于环境标准。

(3) 的程序是在清理开始之前设计和批准的。 它要求对挖掘过程中暴露的所有土壤进行随机抽样,由经过认证的实验室对样本进行分析,并应用学生 t 检验。同样,为了证明成功,平均值的合适的置信上限 (UCL) 必须小于标准。它没有具体说明要采集多少样本:这将由责任方决定。

在前两个阶段获得并分析了近千个样本。尽管这些允许可靠地表征铅浓度的(单变量和空间)分布,但它们当然不代表剩余的浓度。然而,他们确实提出了剩余浓度的(单变量)分布的形状。物理和化学理论、土壤科学以及修复其他地方土壤中铅的经验都为这种统计特征提供了支持。

清理工作如此彻底和成功,以至于可能的平均浓度可以忽略不计——比标准低一个数量级以上。基于标准偏差的悲观(高)估计的功效分析都表明,只需要两个或三个随机样本。

有许多潜在的复杂性:例如,在挖掘过程中可能被忽视的任何区域都可能引入较大的异常值。为了检测这些,在随机位置获取了大量样本,然后分组组合,仅生产五个物理样本用于实验室测试。所有的值都很低。正如预期的那样,对这些样本中的任何两个进行 t 检验仍会证明达到了。

在这个简短的案例研究中,我们可以确信即使样本很小,t 检验也适用的各种方法的示例:经验;理论; 初步相关抽样;做出悲观的假设;样本合成都发挥了作用——其中任何一个都可能足以证明 t 检验的合理性。


顺便说一句,有一些版本的 t 检验只需要一次观察。它们基于获得对方差的独立估计,或者缺乏数学理论。 这在现实中是否有意义?合成数百名士兵的血液以检测性病的经典情况提供了一种可能的应用。