我正在分析调查结果,其中大多数回复以李克特量表的形式出现。其中许多量表在底部类别中的响应非常少或为 0。可以想象,当我尝试运行我的模型时,这会导致一些复杂性。我仍然得到令人鼓舞的结果,但想在报告之前确保我的信息是有效的。以下是我过去几天一直在使用的场景:
我正在使用 SPSS 运行带有两个预测变量的序数回归。在这种情况下,预测变量本身实际上是李克特量表上的响应(但作为名义变量输入模型)。当然,我的 DV 也是一个顺序量表。我的两个预测变量各有五个类别(量表级别)。我的因变量也有 5 个级别。就像我的预测变量一样,因变量在底部类别中的观察值非常少。事实上,当我运行回归时,它显示 47.5% 的单元格的频率为 0。但我所有的系数都很显着,整体模型拟合(-2 对数似然)在 0.000 时显着,优势比(指数形式我的系数)似乎都是合理的。除了这些频率为 0 的单元之外,该模型看起来还不错。
我的测试未通过比例优势假设,即每个预测变量类别的系数在所有 DV 水平上必须相等。我知道这一点是基于平行线测试的结果,SPSS 将其报告为序数回归输出的一部分。所以,根据我在网上找到的一篇文章的推荐,我做了两件事来进一步探索。首先,我运行了单独的物流带有新因变量的回归,每个变量都代表我原始 DV 中的一个切点——换句话说,它们表明 Y 是否小于我的每个原始 DV 类别(不包括底部的类别)。所以我的新DV是2级或以上而不是;3级或以上与否;等等。对于大多数 IV-DV 组合(细胞),这些并没有产生显着的关系。这个想法是比较不同切点的优势比,看看它们是否相当恒定。就我而言,因为很少有重要的,所以它们不是。
我做的第二件事是使用我的原始因变量估计单独的序数回归——我为我的预测变量中的每个类别做了一个模型,编码为假人。因此,在 10 个单独的模型中(2 个预测变量,每个模型 5 个类别),我的单个预测变量将是:1 代表级别 2,0 代表所有其他级别;或 1 表示 3 级,0 表示所有其他级别;等等。对于这些类别中的大多数,平行线是失败的(即,支持比例赔率假设的零被证明是正确的——一件好事)。然而,在其中几个类别中,我没有观察到(没有人在我的预测李克特量表中回答非常差或差)。因此,我无法获得这些类别的平行线 P 值。
我的问题有两个部分。
一个是预测变量的底层是否导致平行线测试失败……如果原因是在这些类别中没有观察到,我是否仍然可以使用我的完整模型中的整体奇数比。我认为这应该没问题,因为这些类别会自动退出模型。
第二个问题是,是否可能是我的 DV 底层的低频/0 频率导致平行线测试失败。我不认为这是基于对所有具有观察值的预测变量类别都通过了测试的事实。我尝试结合我的 DV 的底部类别,这减少了频率为 0 的单元格的百分比,但并不能完全消除问题。
非常感谢您花时间考虑我的问题。如果您能提供任何指导,我将不胜感激。