我正在使用quantreg包使用数据集中我的值的第 99 个百分位来制作回归模型。根据我之前提出的 stackoverflow问题的建议,我使用了以下代码结构。
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
我显示在我的数据之上。我用 ggplot2 绘制了这个,点的 alpha 值。我认为在我的分析中没有充分考虑我的分布尾部。这可能是因为有个别点被百分位数类型测量忽略了。
其中一条评论建议
包小插图包括关于非线性分位数回归的部分以及带有平滑样条的模型等。
根据我之前的问题,我假设了一个对数关系,但我不确定这是否正确。我以为我可以在第 99 个百分位区间提取所有点,然后分别检查它们,但我不知道该怎么做,或者这是否是一个好方法。对于如何改进识别这种关系的任何建议,我将不胜感激。
