我可以结合几个序数问题来创建索引和/或复合度量吗?

机器算法验证 民意调查 参考 序数数据 心理测量学 合成的
2022-03-09 20:06:42

我正在使用一项调查,其中包含有关政策研究机构各个方面绩效的几个问题。在这里,政策领域的表现被分解为以下内容:

  • 研究质量,
  • 与政策利益相关者接触的整体能力,
  • 建议的质量、对决策者的总体支持和影响,
  • 等等

每个问题都有一个典型的 5 级排名(即,从“非常不同意”到“非常同意”,或从“非常差”到“非常好”的序数响应)。

我正在考虑采取以下两种选择中的任何一种:

  1. 创建一种复合度量,将所有性能维度聚合在一起,以便拥有一个“性能”复合变量。然后我可以使用这个复合变量作为因变量(对性能的看法)。

  2. 结合其中的 20 个问题来创建绩效指数。对于每个维度,回答的范围在 1 到 5 之间。因此,该指数的总分因此范围从最低 20 分到最高总分 100 分。该指数也可以用作因变量。或者也许仅用于描述性统计。

这有意义吗?任何建议和参考将不胜感激。

2个回答

是的,你的两个观点都非常有道理,而且确实是一种标准做法——至少在一个叫做心理测量学的领域是这样。

但我不能同意标题问题:它并不总是对序数变量有效。在一般情况下,不能添加或减去按序数尺度测量的值,并希望结果独立于序数变量概念中的任意性。

序数变量是区间变量的特例;我们不能说变量的相邻水平彼此相距多远。例如,教育(在许多情况下是一个有效的序数变量)可以用 3 个级别来衡量:

  • 小学教育
  • 中学教育
  • 高等教育

这 3 个级别通常在内部映射为数值“1”、“2”和“3”——但这种映射完全是任意的。可以同样将这些级别映射为“1”、“10”、“100”或“8”、“12”、“17”(最后一个示例是对教育年限的粗略估计)或使用该程序来自 Witkowski 的论文。为序数变量设计的所有统计过程对于应用于与级别关联的值的任何单射函数都是不变的现在想象一下,我们让受试者说出父母的受教育程度。现在我们要建立一个父母教育指数——通过简单地平均父母的教育水平。

现在,结果将高度依赖于教育水平和数字之间的映射,这些映射在内部代表它们。对于最典型的情况(“1”、“2”和“3”),如果父母一方受过小学教育,另一方受过高等教育,并且父母双方均受过中学教育,则求平均值的过程产生相同的水平“2”。这个特征可能正确,也可能不正确,这取决于分配的数值在我们看来如何代表每种教育的实际价值。

您提到的典型的 5 级排名(又名李克特量表)是专门设计的,即连续级别之间的语义距离大致保持不变。由于这个属性,这些变量可以归类为区间,因此我们可以继续进行加法(或算术平均值,或任何其他数学操作)。

我在这里假设您的学习要求大致如下:

给定每个候选人(在您的案例中是政策研究机构)对 n 个问题的序数响应,通过将 n 维响应元组的元素功能性地组合成一个分数/度量来对候选人进行排名/排序。

然后也许你可以看看 Wittkowski 等人的工作。(2004) 及其中的参考文献,关于结合多个序数变量进行评分。

参考: