如何比较两组

数据挖掘 数据集 统计数据 距离
2022-02-26 11:35:04

我需要比较两组人,其中自变量是拥有大学学位,因变量是收入。

问题是,如果我将研究的整个人群分成两组,其中一组的人明显更多,因此均值受每组的大小和异常值的影响。

我如何证明或拒绝在研究人群中拥有大学学位可以确保更高收入的理论?

1个回答

我假设您正在执行独立样本 t 检验。N 不同并不一定是个问题——均值是一个无偏估计量——但样本量有多大不同呢?正如您所描述的,您可能违反了方差同质性假设。

T 检验往往对这种违规行为相当稳健,但您可能会考虑进行一些异常值处理和/或使用非参数检验。