关于分位数回归结果的解释

机器算法验证 回归 分位数回归
2022-03-16 02:51:53

在对数据集 WBC(威斯康星州乳腺癌)应用 t=0.5,0.6 的分位数回归后,有 678 个观察值和 9 个自变量()和 1 个因变量(op)我得到了以下结果对于 beta 值。inp1,inp2,...inp9

| t         |  0.5          |  0.6      |
| b1        |  0.002641     |  0        | 
| b2        |  0.045746     |  0.01     | 
| b3        |  0.005282     |  0        | 
| b4        |  0.004397     | -0.002    | 
| b5        |  0.002641     |  0.004    | 
| b6        |  0.065807     |  0.1111   | 
| b7        |  0.005282     |  0.002    | 
| b8        |  0.031394     |  0        | 
| b9        |  0.004993     |  0        | 
| intercept | -0.181388     | -0.009    | 

如何解释上述 beta 系数以及它们的确切含义是什么?

  • t=0.5 意味着我们是否考虑了总数据的前 50%?
  • t=0.6 意味着我们正在考虑总数据的前 60%?

我们能写出一个像这样的方程吗

y=intercept+i=19biinpi 像线性回归一样计算 y 的预测输出?

如果我们考虑 5 个分位数的数据,这是否意味着我们将数据分为 5 个部分?如果要将数据分为 5 个部分,我必须考虑哪些变量?

我有 5 个方程对应 5 个分位数,每个方程到底代表什么?我可以通过组合每个分位数的 5 个方程为数据集编写单个方程,如平均回归吗?

2个回答

您可以以与 OLS 回归非常相似的方式解释分位数回归的结果,不同之处在于,分位数回归不是预测因变量的平均值,而是查看因变量的分位数。通过选择 0.5 和 0.6,您使用的是第 50 个和第 60 个百分位数。

我在这里的博客上写了关于分位数回归的文章。我还做了一个关于它的演示,使用 SAS 中的 PROC QUANTREG 进行分位数回归

使用 OLS 可以预测给定 xs 的平均值,使用中值回归可以预测给定相同 xs 的中值,因此如果您估计第 1 个四分位数的回归,您会得到给定相同 xs 的预测第 1 个四分位数。