两组样本量小且不平衡——怎么办?

机器算法验证 t检验 样本量
2022-03-13 21:18:42

我有两组数据(即样本)我想比较,但总样本量很小(n = 29)并且非常不平衡(n = 22 vs n = 7)。

这些数据在逻辑上难以收集且成本高昂,因此虽然“收集更多数据”作为一种明显的解决方案在这种情况下并没有帮助。

测量了许多不同的变量(出发日期、到达日期、迁移持续时间等),因此有多个测试,其中一些方差非常不同(较小的样本具有较高的方差)。

最初,一位同事对这些数据进行了 t 检验,其中一些具有统计学意义, P <0.001,另一个不显着, P = 0.069。有些样本是正态分布的,有些则不是。一些测试涉及与“相等”方差的较大偏差。

我有几个问题:

  1. t检验在这里合适吗?如果不是,为什么?这是否仅适用于满足正态性和方差相等假设的测试?
  2. 什么是合适的替代品?也许是一个排列测试?
  3. 不等方差扩大了第一类错误,但如何?小的、不平衡的样本量对 I 类错误有什么影响?
2个回答

当两个总体具有不同的方差时,假设两个总体的方差相等的 T 检验无效,并且对于不相等的样本量更糟。如果最小的样本量是具有最大方差的样本量,则测试将夸大 I 类错误)。另一方面,t 检验的 Welch-Satterthwaite 版本不假设方差相等。如果您正在考虑 Fisher-Pitman 置换检验,它也假设方差相等(如果您想从低 p 值推断不相等的均值)。

您可能还需要考虑许多其他事情:

(1) 如果方差明显不相等,您是否仍然对均值之间的差异如此感兴趣?

(2) 效应估计可能比 p 值对您更有用吗?

(3) 您是否想考虑数据的多变量性质,而不是仅仅进行一系列单变量比较?

首先,正如 Scortchi 已经指出的那样,T 检验不太适合您的数据,因为它假设了数据的分布。

对于您的第二点,我会提出 T 检验的替代方案。如果您的兴趣仅在于事实,如果您的两个样本的分布是否相等,您也可以尝试使用 Wilcoxon 秩和检验的双边版本。Wilcoxon 秩和检验是一种非参数检验。如果您不确定数据的基本分布,这种测试特别有用。

它存在针对小样本量和大样本量的测试的精确解。此外,还有一个实现Wilcoxon秩和检验的R包。

由于它是无参数测试并且还处理小样本量,因此该测试应该非常适合您的测试用例。