由于我对统计和临床试验完全陌生,因此我会向您寻求帮助和澄清。
假设我们有 2 个非常小的样本(每个 n = 2 左右)来自两个正态分布的无限种群(每个样本的 sigma 未知)。我们想检查这些总体的均值是否存在显着差异(alpha = 0.05)。为此,我们对均值的差异进行 t 检验并达到统计显着性(p 值 = 0.04)。
有人告诉我,这种方法是错误的,不能从对如此小样本量的测试得出的 p 值进行推断。我不懂为什么。
我知道,如果样本量很小:
- 我们无法检验总体正态性(t 检验基于此假设)
- 我们样本的平均值更可能远离总体平均值
- 我们样本的方差更容易被低估
但我想,如果:
- 我已经知道,我的人口是正态分布的
- 平均值的 SD 取决于样本量
- t 检验考虑了低估总体方差的问题(事实上,t 分布取决于样本量,样本量越小,方差被低估的越多;对吗?)
这解决了所有问题。我知道这样我会得到非常大的置信区间,但是当差异足够大时,我仍然能够获得显着性。据我了解,更宽的置信区间是对总体均值和方差的不准确估计的“惩罚”。但是为什么 p 值也应该被认为是错误的呢?分布是正常的,所以我没有违反任何假设。
如果 p 值不显着(p>0.05),我绝对不会推断零假设是正确的,因为我知道这个测试很可能功率不足。我只想知道如何解释获得的显着 p 值以及为什么它不像从 n = 30 的样本中得出的显着 p 值那么有价值?
为了扩展这个问题,如果人口分布未知并且我使用某种非参数检验而不是前面提到的 t 检验会发生什么?
谢谢!