我有两组数据(即样本)我想比较,但总样本量很小(n = 29)并且非常不平衡(n = 22 vs n = 7)。
这些数据在逻辑上难以收集且成本高昂,因此虽然“收集更多数据”作为一种明显的解决方案在这种情况下并没有帮助。
测量了许多不同的变量(出发日期、到达日期、迁移持续时间等),因此有多个测试,其中一些方差非常不同(较小的样本具有较高的方差)。
最初,一位同事对这些数据进行了 t 检验,其中一些具有统计学意义, P <0.001,另一个不显着, P = 0.069。有些样本是正态分布的,有些则不是。一些测试涉及与“相等”方差的较大偏差。
我有几个问题:
- t检验在这里合适吗?如果不是,为什么?这是否仅适用于满足正态性和方差相等假设的测试?
- 什么是合适的替代品?也许是一个排列测试?
- 不等方差扩大了第一类错误,但如何?小的、不平衡的样本量对 I 类错误有什么影响?