分位数回归中的 R 平方

机器算法验证 r平方 分位数回归
2022-01-16 13:44:40

我正在使用分位数回归来查找我的数据的第 90 个百分位数的预测因子。我正在使用quantreg包在 R 中执行此操作。如何确定,这将表明预测变量解释了多少可变性?r2

我真正想知道的是:“我可以使用任何方法来找出解释了多少可变性?”。P 值的显着性级别在命令的输出中可用:summary(rq(formula,tau,data))我怎样才能获得合身性?

2个回答

Koenker 和 Machado描述了 ) 分位数处拟合优度的局部度量。[1]R1τ

V(τ)=minbρτ(yixib)

为完整模型和受限模型的系数估计,并让为对应的项。β^(τ)β~(τ)V^V~V

他们定义了拟合优度标准R1(τ)=1V^V~

Koenker在这里给出的代码,V

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

因此,如果我们为仅具有截距的模型( - 或,然后是不受限制的模型(),我们可以计算出- 至少在概念上 -有点像通常的VV~V0V^R1 <- 1-Vhat/V0R2

编辑:当然,在您的情况下,第二个参数将放在f$tau第二行代码的调用中的 where is 中,它将是tau您使用的任何值。第一行中的值仅设置默认值。

“解释平均值的方差”实际上不是您对分位数回归所做的事情,因此您不应该期望有一个真正等效的度量。

我认为的概念不能很好地转化为分位数回归。您可以像这里一样定义各种或多或少的类似量,但无论您选择什么,您都不会拥有实际在 OLS 回归中具有的大部分属性。您需要清楚哪些属性是您需要的,哪些是您不需要的——在某些情况下,可能有一个度量标准可以满足您的需求。R2R2

--

[1] Koenker, R 和 Machado, J (1999),
分位数回归的拟合优度和相关推理过程,
美国统计协会杂志,94 :448, 1296-1310

Koenker 和 Machado (1999)在 JASA 中建议的伪度量通过比较感兴趣模型的加权偏差总和与仅出现截距的模型的相同总和来测量拟合优度。它计算为R2

R1(τ)=1yiy^iτ|yiy^i|+yi<y^i(1τ)|yiy^i|yiy¯τ|yiy¯|+yi<y¯i(1τ)|yiy¯|,

其中是观测的拟合 th 分位数,而是仅截距的拟合值模型。y^i=ατ+βτxτiy¯=βτ

R1(τ)应该位于中,其中 1 对应于完美拟合,因为由偏差加权和组成的分子为零。它是适合 QRM 的局部度量,因为它取决于 ,与OLS的全局这可以说是有关使用它的警告的来源:如果您的模型适合尾部,则不能保证它适合其他任何地方。这种方法也可用于比较嵌套模型。[0,1]τR2

这是R中的一个例子:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

这可能会更优雅地完成。