KS 测试和 Kruskal-Wallis 评估医疗数据集的适用性

机器算法验证 假设检验 t检验 卡方检验 kolmogorov-smirnov 测试 克鲁斯卡尔-沃利斯测试
2022-04-19 12:41:18

我正在分析我正在写的一篇论文的一些统计数据。我可以通过我的教职员工获得统计帮助,但有几个月不在那里,所以希望你能提供帮助。

n = 463,2 个患者组(<70 & >= 70 岁)。使用 SPSS。

测试评估了一大堆统计数据- 它们是分类的,例如吸烟史 (T/F)、吸烟电流 (T/F)、BMI>30、糖尿病等。到目前为止一切顺利(除非有人能告诉我这是否是一个不合适的测试?)χ2

我有更多变量,例如术前肌酸、ICU 停留时间等,这些变量不是正态分布的(我以前知道如何“正确”测试正态性,但我刚刚绘制了 QQ 图,看看它们是否在我的意图是使用学生的 t,但我生疏的统计知识告诉我现在不能,因为它们不是正态分布的。

在许多方面,我使用了一位朋友的统计方法,他使用类似的数据集写了一篇类似的论文,对于他的连续变量,他使用了Kolmogorov-Smirnov,但我不确定他是否只是将其用于正态性。然后他说他使用Kruskal-Wallis来评估这些变量,但我不知道为什么这是合适的。

有人介意向我解释这些测试是否适合比较这些样本吗?

1个回答

1)仅评估您假设的情况下的正常性。(我认为这不是您的问题,但这是一个常见问题,因此值得一提。)

2)在检查正态假设时,QQ 图正式的假设检验更好——假设检验实际上并不能回答相关问题。

3) Kruskal-Wallis 检验是基于非参数秩的等效于单向方差分析。Kruskal-Wallis 适用于 Wilcoxon-Mann-Whitney 两样本检验,就像单向方差分析适用于两样本 t 检验。当您要针对两个以上的组具有相同位置的空值进行测试时,可以使用它。

希望这会有所帮助。

--

如果您想专门测试均值差异,则 KS 测试和 WMW 都不会真正做到(尽管有一些额外的假设,WMW 也是对均值差异的测试)。

测试均值差异的最佳方法可能是进行置换测试,只要在 null 下的分布相同(因此,如果您的替代方案是位置偏移,那么您基本上假设除了相同的形状之外地点)。

单样本 KS 测试是对完全指定分布的测试 - 它可以测试您可以为其提供 pdf 的任何连续分布 - 您不会使用它来测试数据的正态性,因为除非您知道总体参数,否则分布没有完全指定...如果您知道总体参数,则无需测试均值!您可以使用 Smirnov 测试(两个样本 KS 测试)来测试两组之间的任何差异,但如果您的兴趣是手段差异,那么它不是一个非常强大的测试。

您对 KS 测试的内容感到困惑可能是因为您将两者(一个和两个样本测试)混为一谈 - 它们用于不同的事情。

是的,应用于两个样本的 Kruskal-Wallis 将给出与双尾检验的 Wilcoxon-Mann-Whitney 相同的结果(即,它不允许单边选择,就像单向测试一样ANOVA 没有为您提供通过双样本 t 检验可以获得的单边替代方案,而卡方不提供双样本比例检验的单边替代方案)。