是否有用于预测响应等级的规范回归方法?
我想将回归拟合到一个数据集,其中响应非常不正常,异常值非常大。大约有 10 个预测变量。我在转换方面没有取得多大成功(最好的方法是添加一个常量,然后记录两次响应,但这不是很容易解释)。
但是,我只关心响应的等级。响应实际上只是一个分数,用作对观察结果进行排名的工具。我真正想知道的是哪些预测变量解释了排名中最大的变化。
我的方法如下:
- 计算响应的等级。即对于每个观察,计算
- 假设是观察次数。然后,近似地,
- 通过概率积分变换,
- 对预测变量的回归中使用作为我的响应
由于这些秩和逆 CDF 变换是单调的,因此保持秩,我认为这种回归方法将帮助我确定哪些协变量最能预测秩。
这种方法有效吗?有没有更好或更标准的方法来预测一组协变量的排名?谷歌搜索,我发现了这篇论文,但我不知道这种方法是如何被接受或广为人知的:https ://journal.r-project.org/archive/2012-2/RJournal_2012-2_Kloke+McKean.pdf
谢谢!