将 n 点李克特量表数据视为来自二项式过程的 n 次试验是否合适?

机器算法验证 二项分布 李克特 心理测量学 心理学
2022-03-03 22:20:17

我从来不喜欢人们通常如何分析李克特量表的数据,就好像错误是连续的和高斯的,当有合理的预期至少在量表的极端情况下这些假设被违反。您如何看待以下替代方案:

如果响应有价值k在一个n-point scale,将该数据扩展到n试验,k其中的值为 1 和nk其中的值为 0。因此,我们将李克特量表上的响应视为一系列隐蔽的二项式试验的公开集合(事实上,从认知科学的角度来看,这实际上是一个吸引人的模型此类决策场景中涉及的机制)。通过扩展数据,您现在可以使用混合效应模型将受访者指定为随机效应(如果您有多个问题,也可以将问题作为随机效应)并使用二项式链接函数指定误差分布。

任何人都可以看到这种方法的任何违反假设或其他不利方面吗?

4个回答

我不知道心理测量学文献中有任何与您的问题相关的文章。在我看来,允许随机效应组件的有序逻辑模型可以很好地处理这种情况。

我同意@Srikant 并认为比例赔率模型或有序概率模型(取决于您选择的链接函数)可能更好地反映李克特项目的内在编码,以及它们在意见/态度调查或问卷中作为评级量表的典型用途.

其他替代方法是:(1)使用相邻类别而不是比例或累积类别(与对数线性模型相关);(2)使用项目反应模型,如部分信用模型或评级量表模型(正如我在李克特量表分析中提到的那样)。后一种情况与混合效应方法相当,受试者被视为随机效应,并且在 SAS 系统中很容易获得(例如,使用 NLMIXED 程序为重复的序数结果拟合混合效应模型)或 R(参见第 1卷)。 20统计软件杂志)。您可能还对 John Linacre 提供的关于优化评级量表类别有效性的讨论感兴趣。

以下论文也可能有用:

  1. 吴,CH(2007)。李克特量表数据转化为数值分数的实证研究应用数学科学1(58):2851-2862。
  2. Rost, J 和罗, G (1997)。基于 Rasch 的展开模型在青少年中心主义问卷中的应用在 Rost, J 和 Langeheine, R (Eds.),潜在特征和潜在类别模型在社会科学中的应用,纽约:Waxmann。
  3. Lubke, G 和 Muthen, B (2004)。在多元正态性假设下对李克特量表数据进行因子分析会使观察组或潜在类别的有意义比较复杂化结构方程建模11:514-534。
  4. Nering, ML 和 Ostini, R (2010)。多分项反应理论模型手册劳特利奇学术
  5. Bender R 和 Grouven U (1998)。将二元逻辑回归模型用于具有非比例优势的序数数据。临床流行病学杂志51(10):809-816。(找不到pdf,但有这个,医学研究中的序数逻辑回归

如果您真的希望放弃对李克特量表的区间水平数据的假设,我建议您将数据假设为有序 logit 或 probit。李克特量表通常衡量反应的强度,因此较高的值应该表明对感兴趣的潜在项目的反应更强。

假设你有一个H项目规模和那个S表示对感兴趣项目的未观察到的响应强度。然后您可以假设以下响应模型:

y=1如果Sα1

y=h  如果αh1<S αh为了h=2,3,..H1

y=H  如果αH1<S< 

假如说S遵循具有未知均值和方差的正态分布将给出有序概率模型。

一个问题是,通过使用这种方法,您在均值之间施加了特定的关系np和方差np(1p)的回应。对于经常使用李克特量表的那种调查——例如,对于某些陈述,您从“非常同意”到“非常不同意”之间选择五个类别之一——这对我来说感觉不对。例如,如果您折叠相邻的类别对,我希望十点量表给出与五点量表大致相同的响应分布:对于响应y& 常见的p

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
我记得一些似乎证实了这一点的研究:Coelho & Esteves (2006),“客户满意度测量框架中五分制和十分制之间的选择”。

如果您将同意和非常同意合并到一个组中,将不同意和非常不同意合并到另一组,您可以在 5 分李克特量表中使用二项式近似。当然,你仍然需要决定中立者的去向。我会将中性点放在任何一个组中,使用二项式的正态近似值(假设您有 40 多个响应),并根据每个组的比例制定置信区间(请参阅任何标准统计文本,了解如何获得 conf.来自具有正态近似的二项式分布的比例区间)。然后,我会将中性点放在另一组中,并重做置信区间。如果我从两者中得到相同的结论,那么就有一个潜在的结论。否则,我看不出二项式如何与李克特数据一起使用。