我正在对一些有序的因变量(大约 70 个)进行一些推理分析。它们的量表范围为 4-10 个可能的(有序)响应。给出一些背景信息,这都是社会数据——幸福感、对少数族裔的感情等等——我的推论问题是关于大学学位的社会回报。
对于我的二元和连续因变量(不是这个问题的一部分),我有一组很好的控件。其中不少是分类的(你上过私立高中吗?你的婚姻状况如何?),还有一些是连续的或虚拟的。
我的问题是,当我对有序变量使用相同的控件时,我会得到大量空的结果级别/分类自变量组合。例如,没有鳏夫给自己的幸福评分为 2。由于这种情况很多,R 函数 polr 和 lrm 不起作用(如果不是这种情况,请告诉我)。
那么,选择似乎(对我来说)是:
a) 减少控制集以消除空单元格,或
b)在ols中做。
我知道对于我的分类数据,不满足 ols 的假设。但是鉴于我的任务,我想知道这两种解决方案都会损失多少?