如何测试多个李克特项目的中位数之间的差异?

机器算法验证 李克特 中位数 序数数据
2022-03-18 02:32:36

在一项问卷调查中,我们要求受访者表达他们对不同冬季气候因素(如雪、滑)如何影响他们选择步行和骑自行车上班的态度。样本由 500 人组成,答案采用 5 个等级的形式,从非常负面到非常正面(序数量表)。

如果我想比较对不同问题的回答,我猜中位数是一个合适的工具,因为数据是有序的。我知道比较意味着有不同的统计检验来显示差异的概率是否显着(t 检验或非参数检验..)。但是如果我可以对我在这里解释的数据类型使用这些测试,我会有点困惑。

  • 是否有用于比较中位数的测试统计数据?
  • 或者如果合适的话,我应该将数据传输到区间尺度?
3个回答

我发现平均值是比中位数更有用的李克特项目集中趋势指标。我在这里详细阐述了我的论点,该问题询问是否对 likert 项目使用均值或中值

回顾其中一些原因:

  • 平均值提供更多信息;对于李克特项目来说,中位数太严重了。例如,中位数与(即 3)1 1 3 3 3相同,但均值反映了差异。3 3 3 5 5
  • 李克特项目通常以类别之间的相等距离​​假设是一个有用的起点的方式来表达。
  • 即使个人的反应是离散的,群体水平的测量也接近连续性(500 人和 5 分制,你的平均值可能取500 * 4 + 1 = 2001不同的值)
  • 在是-否类型的问题(例如,投票)中,百分比是一个有用的总结几乎没有争论。这只是响应被编码的平均值0 and 1对我来说,对待 5 点李克特量表1 2 3 4 5几乎是自然而然的。
  • Likert 项目的其他合理比例可能不会实质性地改变关于均值之间是否存在差异的推论(但您可以检查这一点)。

如果您确信均值是集中趋势的适当度量,那么您将需要构建假设检验,以便它们检验均值之间的差异。配对样本 t 检验将允许对均值进行成对比较,但考虑到离散和非正态误差分布,p 值的准确性会存在问题。尽管如此,采用非参数方法并不是一个解决方案,因为它改变了假设。

我希望配对样本 t 检验至少对于典型的李克特项目来说是相当稳健的,这意味着避免规模上的任何一个极端,但我手头没有任何模拟研究。

一般来说,我同意杰罗米的论点,即平均值是李克特量表的合理统计数据。可以说中位数的是,中位数是一种更强大的位置衡量标准,因为它可以防止异常值(它的最高可能分解点为 50%)。但是,由于李克特量表是有界量表,极端异常值的可能性非常低(仅当您的数据极度偏斜时)。此外,中位数通常会从数据中修剪太多,因此您可以考虑使用修剪后的平均值。通常建议修剪 20% 的量 [1]。

如果您想计算中位数差异的配对检验,我建议使用百分位自举法比较均值(这是比较中位数的唯一方法,在捆绑值的情况下效果很好,请参阅 Wilcox,2005 [ 1])。

在 R 的WRS包中,有一个函数调用trimpb2,它对两个独立的样本进行此计算(您也可以使用该函数计算修剪均值的 ap 值)。但是,在您的情况下,您需要比较依赖组。在这种情况下,您还可以执行偏差调整的百分位自举法 [2]。

但是请注意,边际分布中位数的差异查看差异分数的中位数不同。第一个回答“第一组的典型反应与第二组有何不同”这个问题,由 WRS 功能执行rmmcppb第二个回答“什么是典型的差异分数”这个问题,由 WRS 函数执行rmmcppbd

[1]威尔科克斯,RR (2005)。稳健估计和假设检验简介。圣地亚哥:学术出版社。

[2]威尔科克斯,RR (2006)。基于中位数的依赖组的成对比较。计算统计与数据分析,50,2933-2941。doi:10.1016/j.csda.2005.04.017

比较中位数的一种选择是置换检验但是,如果您要比较由同一组人(配对数据)填写的两个问题的答案,那么您可能还想查看McNemar 的测试及其变化。

为了扩展一点,McNemar 检验(及其扩展)的想法是查看一个矩阵,其中包含有多少受访者选择了组合的计数,因此个人将有助于计算其列由下式确定的单元格中的计数他们对问题 1 和行的回答取决于他们对问题 2 的回答(表或交叉表命令创建矩阵)。这个矩阵中的模式可能比简单的平均值或中位数更能提供信息。对角线代表对 2 个问题的回答相同的人,上三角表示第一个问题的回答高于第二个问题的人,下三角表示差异。与对角线的距离表明 2 个答案有多么不同。McNemar 检验的变体查看 2 个三角形中的计数是否不同,或者如果矩阵是对称的。为了考虑数据的序数(相对于名义)性质,要考虑到对角线的距离。

仅查看表中的模式可能就足以满足您的目的,但如果您需要正式测试,那么您可以使用建议的测试,或进行某种形式的置换测试(具体如何取决于您要查找的内容)或试图展示)。