如何测试五点变量的组差异?

机器算法验证 非参数 统计学意义 离散数据
2022-04-01 02:03:07

我有一系列的观察结果属于分类(或“分数”);也就是说,数据可以是 0、1、2、3 或 4。这样的数据有两组,控制组和处理组。我知道每个组每个分数的人数。

确定这些组是否不同的最佳方法是什么?

一位同事建议将数据排列为具有给定分数的单个数据点,并对这两列数据进行分析。由于每组有十个人,这并不难,但我不相信我得到了一个有效的答案。

3个回答

您正在寻找的似乎是比较两组观察结果是有序数据的测试。在这种情况下,我建议应用趋势测试来查看 CTL 和 TRT 组之间是否存在差异。

使用 t 检验不会承认您的数据是离散的事实,并且如果分数分布不是对称的,那么高斯假设可能会被严重违反,这通常是李克特分数的情况(例如您似乎报告的分数)。不知道这些数据是否来自病例对照研究,但您也可以应用@propfol 建议的基于等级的方法:如果它不是匹配设计,则 Wilcoxon-Mann-Whitney 检验(wilcox.test()在 R ) 很好,并要求一个精确的 p 值,尽管您可能会遇到绑定观察的问题。如果正态性成立,WMW 测试的效率相对于 t 检验是,但我似乎记得,否则它可能会更好。3/π

鉴于您的样本量,您还可以考虑应用排列测试(请参阅permcoin R 包)。

还要检查那些相关的问题:

想到三件事:

  1. 使用 Fisher 精确检验或卡方检验的列联表分析(但只会告诉您表中的某处存在显着差异。您必须可视化您的数据或进行事后测试才能知道这种差异在哪里。 ) 不是我的首选解决方案。
  2. 一种非参数方法,例如 Mann Whitney 检验。这将对每个组中的所有分数进行排名。一个很好的方法,但可能动力不足。
  3. 一种参数化方法(例如在测试中)。缺点是可能会违反这种方法的假设,尤其是在样本如此小的情况下。此外,0 和 1 之间的差异不太可能与 3 和 4 之间的差异相同(取决于您测量的内容)。好消息是 t 检验对您应该假设的假设相对稳健在使用测试之前确保为真。然而,正如我所说,样本量相当小。

最好的选择可能是 Mann Whitney 测试。

这个问题有点不寻常,因为“不同”的性质是不确定的。这种反应是本着试图检测尽可能多的差异的精神制定的,而不仅仅是位置的变化(“趋势”)。

Kolmogorov-Smirnov 检验是 Kolmogorov-Smirnov 检验:作为检验统计量使用的一种方法可能比大多数方法更有效,同时对五个组所代表的相对大小(例如,采用多项模型)保持不可知论(例如,采用多项模型)但保留组的顺序两个经验 cdf 之间最大偏差的大小。这计算起来既简单又快速,而且通过合并两组结果来引导 p 值也很容易。

具体来说,让中的计数为那么组的经验 cdf本质上是向量其中检验统计量是这两个向量之差的 sup norm。jikiji(0=mi0,mi1,,mi5=ni)/nimi,j=mi1,j+kij,1i5

两组十个人的临界值(α=0.05