来自离散有序响应的因子得分

机器算法验证 因子分析 序数数据
2022-03-05 01:18:38

当您有有序的离散变量时,是否有一种原则性的方法来估计因子得分。

我有序数的离散变量。如果我假设每个响应的基础是一个连续的、正态分布的变量,那么我可以计算一个多元相关矩阵。然后我可以对这个矩阵进行因子分析并获得每个变量的因子载荷。nn×n

如何结合因子载荷和变量来估计因子分数。估计分数的典型方法似乎要求我将序数数据视为区间。

我想我可能需要更深入地挖掘多元相关性的核心来找出链接函数。

3个回答

“有原则的”方法(也就是说,在经验上可能不会产生太大影响的先验防御方法)是使用分级响应模型,这是 IRT 家族中一个相当有用的成员,通常用于李克特类型的项目。R 包ltm使这非常简单。

然后,您假设未观察到的特征与您的每个指标之间存在序数逻辑回归关系。选择这个模型类可以让您认真对待指标的序数性质,并提供有关每个项目最能提供信息的特征部分的信息。像因子分析一样,它会为您提供分数的标准误差,尽管 FA 人似乎出于某种原因忽略了这些。

另一方面,选择这个模型类会限制您执行所有经典因子分析的能力,例如旋转物体,直到您喜欢它们的外观。我认为这是一个优点,但有理智的人不同意。如果您正在做那种事情来找出您有多少“尺度”,那么您将需要查看试图识别尺度的 Mokken 程序,因为 FA“适合另一个维度并旋转到简单结构”赢了不行。

从序数变量指标中提取因子得分是司空见惯的。使用李克特测量的研究人员一直在这样做。因为因子分数是基于协方差的,所以“区间”在项目内部和项目之间可能不统一通常不是什么大问题,特别是如果项目具有可比性并使用合理紧凑的量表(例如,5 或 7 分“同意/disagree”likert items):所有受试者都对相同的项目做出反应,并且如果这些项目确实是某个潜在变量的有效度量,则响应应该显示统一的协方差模式。参见 Gorsuch, RL (1983)。因子分析。新泽西州希尔斯代尔:劳伦斯·厄尔鲍姆。第二。编,第 119-20 页。但是如果你认为序数变量的响应是线性的——或者更重要的是,如果您想要的因子分数不是线性的,而是反映分类项目之间反复出现的非线性关联(如果您的变量是名义或定性的,您会这样做) - 您应该使用非线性缩放替代传统因子分析,例如潜在类分析或项目反应理论。(当然,此查询与您关于在 logit 回归模型中使用序数预测变量的查询之间存在家族相似之处;也许我可以再次激励 chi 或比我了解更多的其他人来对待我们更细粒度的帐户为什么你不必担心——或者也许你应该担心。)t 是线性的,但反映了分类项目之间反复出现的非线性关联(如果您的变量是名义变量或定性变量,您会这样做)——您应该使用非线性缩放替代传统因子分析,例如潜在类别分析或项目响应理论。(当然,此查询与您关于在 logit 回归模型中使用序数预测变量的查询之间存在家族相似之处;也许我可以再次激励 chi 或比我了解更多的其他人来对待我们更细粒度的帐户为什么你不必担心——或者也许你应该担心。)t 是线性的,但反映了分类项目之间反复出现的非线性关联(如果您的变量是名义变量或定性变量,您会这样做)——您应该使用非线性缩放替代传统因子分析,例如潜在类别分析或项目响应理论。(当然,此查询与您关于在 logit 回归模型中使用序数预测变量的查询之间存在家族相似之处;也许我可以再次激励 chi 或比我了解更多的其他人来对待我们更细粒度的帐户为什么你不必担心——或者也许你应该担心。)

我可以在这里澄清一下吗,您是否需要对不同尺度的项目进行预处理和组合(区间、序数、名义),或者您是否只想对序数尺度变量进行因子分析?

如果是后者 - 这是一种方法。

http://cran.r-project.org/web/packages/Zelig/vignettes/factor.ord.pdf

(注意这个链接现在已经失效了)。还有其他小插曲,但没有这个。