有序协变量的编码

机器算法验证 分类数据 预测器
2022-04-12 17:17:35

我正在执行序数回归,我有 5 个响应类别和几个连续和分类的预测变量。我想添加一个分类但有序的预测器(1、2、3、4)。我认为对无序分类预测变量应用通常的虚拟编码是不合适的,但是当我搜索如何编码时,我没有找到太多信息。Steyerberg (2009)中提到了“线性编码”或“假设预测效应的线性”,但没有进一步的细节。这是否意味着我只是按原样使用我的有序值,即将它们用作连续变量?

1个回答

您可以查看Gertheiss 和 Tutz,使用 Ordinal Predictors 进行惩罚回归,以及他们的 R 包ordPens他们说:-

我们建议在估计过程中惩罚相邻类别系数之间的差异,而不是通过简单的最大似然方法来估计参数。背后的理由如下:响应y假设自变量的两个相邻类别之间变化缓慢。换句话说,我们尽量避免跳高,更喜欢更平滑的系数向量。