使用 MM 估计器进行稳健回归的预测区间

机器算法验证 回归 强大的 预测区间 rlm
2022-04-08 14:09:26

Maronna 等人在他们的《稳健统计》一书中。考虑以下稳健回归模型:yi=βxi+ui, 在哪里ui独立于xi,并且是独立同分布的,具有有限方差。他们继续提供可靠的估计β^β这是渐近正态的并给出协方差矩阵β^. 我的问题是,在没有任何关于分布的知识的情况下ui, 是否可以提供一个预测区间y(不使用引导程序)?我问这个是因为

library(MASS)
robustModel = rlm(formula = myFormula, data = myData, method = "MM")
predict.rlm(robustModel, newdata = myNewData, interval = "prediction") 

在 R 中生成一个预测区间。作为参考,这是 predict.rlm 的代码:

predict.rlm <- function (object, newdata = NULL, scale = NULL, ...)
{
## problems with using predict.lm are the scale and
## the QR decomp which has been done on down-weighted values.
object$qr <- qr(sqrt(object$weights) * object$x)
    predict.lm(object, newdata = newdata, scale = object$s, ...)
}

在我看来,以这种方式获得的预测区间适用于正态分布ui. 那是对的吗?我在这里想念什么?

1个回答

如果我们有估算器的实际公式,那么回答这个问题会更容易。但一般来说,估计量的准确分布应该取决于误差分布。然而,协方差矩阵可以从数据中估计出来。准确的预测区间似乎取决于误差项的分布,因此如果不指定误差分布就无法确定。但这并不意味着您无法获得近似的预测区间(请注意,置信区间的问题是相同的)。对于 beta 是一维的示例,协方差矩阵只是单个方差。在 beta 是多维的情况下,会有协方差项。我认为书中的结果涉及更一般的多维情况下的稳健估计。

回到一维情况,可以从数据中估计估计标准偏差,并且可以使用渐近正态分布来获得近似的置信区间和预测区间,理论认为这些区间将具有大 n 的近似置信水平。