我有一系列的观察结果属于分类(或“分数”);也就是说,数据可以是 0、1、2、3 或 4。这样的数据有两组,控制组和处理组。我知道每个组每个分数的人数。
确定这些组是否不同的最佳方法是什么?
一位同事建议将数据排列为具有给定分数的单个数据点,并对这两列数据进行分析。由于每组有十个人,这并不难,但我不相信我得到了一个有效的答案。
我有一系列的观察结果属于分类(或“分数”);也就是说,数据可以是 0、1、2、3 或 4。这样的数据有两组,控制组和处理组。我知道每个组每个分数的人数。
确定这些组是否不同的最佳方法是什么?
一位同事建议将数据排列为具有给定分数的单个数据点,并对这两列数据进行分析。由于每组有十个人,这并不难,但我不相信我得到了一个有效的答案。
您正在寻找的似乎是比较两组观察结果是有序数据的测试。在这种情况下,我建议应用趋势测试来查看 CTL 和 TRT 组之间是否存在差异。
使用 t 检验不会承认您的数据是离散的事实,并且如果分数分布不是对称的,那么高斯假设可能会被严重违反,这通常是李克特分数的情况(例如您似乎报告的分数)。不知道这些数据是否来自病例对照研究,但您也可以应用@propfol 建议的基于等级的方法:如果它不是匹配设计,则 Wilcoxon-Mann-Whitney 检验(wilcox.test()在 R ) 很好,并要求一个精确的 p 值,尽管您可能会遇到绑定观察的问题。如果正态性成立,WMW 测试的效率相对于 t 检验是,但我似乎记得,否则它可能会更好。
鉴于您的样本量,您还可以考虑应用排列测试(请参阅perm或coin R 包)。
还要检查那些相关的问题:
想到三件事:
最好的选择可能是 Mann Whitney 测试。
这个问题有点不寻常,因为“不同”的性质是不确定的。这种反应是本着试图检测尽可能多的差异的精神制定的,而不仅仅是位置的变化(“趋势”)。
Kolmogorov-Smirnov 检验是 Kolmogorov-Smirnov 检验:作为检验统计量使用的一种方法可能比大多数方法更有效,同时对五个组所代表的相对大小(例如,采用多项模型)保持不可知论(例如,采用多项模型)但保留组的顺序两个经验 cdf 之间最大偏差的大小。这计算起来既简单又快速,而且通过合并两组结果来引导 p 值也很容易。
具体来说,让组中的计数为。那么组的经验 cdf本质上是向量其中。检验统计量是这两个向量之差的 sup norm。
两组十个人的临界值(