残差与样本数据的正态性;t检验呢?

机器算法验证 回归 t检验 标准差 残差 正态假设
2022-03-19 06:17:31

除了一般线性模型的推理统计中的正态性检验的常见混淆之外:

我理解正态性假设是指方差分析和回归模型中的残差,但是 t 检验呢?

t 统计量的计算使用标准偏差作为离散度的度量,而不是方差分析和回归中 F 统计量的平方和。如果我理解正确,正是因为这个假设样本是正态分布的(即样本标准偏差提供了对总体标准偏差的准确估计)。这是正确的吗?

如果因变量的统计总体不呈正态分布(因此样本不太可能呈正态分布),您会怎么做?这是适合转换的地方吗?

2个回答

t 检验也是如此。整个数据集不需要呈正态分布(如果组之间的均值存在差异,则不会存在差异),只需残差即可。当然,对于 t 检验,说残差是正态分布的就等于说每个组是正态分布的。

自变量的分布(在 t 检验的情况下,它是组标签)在方差分析、回归等中总是无关紧要的:您对以自变量的给定值为条件的响应变量的分布感兴趣.

所有程序都假设条件正态性,而不是边际正态性。

(考虑:t 检验是具有两组的 ANOVA)

如果您要在 t 检验中分别查看两组的分布(降低您检测共同偏离正态性的能力,但另一方面允许您看到两个分布形状的巨大差异),它是否减去均值并不重要,因为您仍在评估条件正态性。