岭回归的杠杆值是多少?

机器算法验证 协方差矩阵 岭回归 聚集标准错误 稳健标准错误 杠杆作用
2022-04-06 19:37:46

在线性最小二乘法中,参数估计为: β^=(XX)1Xy. 在岭回归中,标准化参数估计由下式给出 β^Γ=(XX+Γ)1Xy.

方差协方差估计器使用杠杆值来解释方差协方差估计中的偏差。对于线性最小二乘法,一些示例包括 HC2 和 HC3,它们具有以下有效残差: u~=u^1hiiu~=u^(1hii)2.hii是模型矩阵的投影矩阵的对角线值h=X(XX)1X.

我的问题是:对于岭回归,杠杆调整残差是否会使用h=X(XX)1X还是他们使用不同的 for 是因为

y^OLS=X(XX)1Xy(XX+Γ)1Xy=y^Γ? 如果不同,形式是什么?它如何推广到集群?

1个回答

岭回归可以通过使用数据矩阵计算的普通最小二乘法 (OLS) 来计算X扩展了一些替代数据,对应于替代观察Y0=0. 将模型用代理数据扩展为

(YY0=0)=(XβX0β)+(ϵϵ0)
使用这个代理公式,我们可以将 USUAL OLS 估计量计算为
(XTX+X0TX0)1(XTY+X0T0)=(XTX+X0TX0)1XTY
并将其与岭估计器的表达式进行比较,表明您需要解决
Γ=X0TX0
为了X0,任何矩阵平方根都可以,例如 Cholesky 分解。

然后,您可以使用常用公式来利用扩展数据矩阵

(XX0)
这是一个(n+p)×p-矩阵,所以n第一个杠杆值对应于数据。作为奖励,您从p最后一个杠杆值,利用代理数据的信息,因此您可以了解代理数据的影响程度。

您还询问集群健壮版本。我不知道这些,但猜想可以使用相同的方法。