交叉验证 (CV) 和广义交叉验证 (GCV) 统计

机器算法验证 交叉验证
2022-01-28 18:01:50

我发现交叉验证 (CV) 统计量和与线性模型相关的广义交叉验证 (GCV) 统计量的定义可能存在冲突(具有正常的同方差误差向量)。Y=Xβ+εε

一方面,Golub、Heath 和 Wahba 将 GCV 估计值定义为 (p. 216)λ^

的最小值 其中A\left(\lambda\right) = X\left(X^TX + n\lambda I\right)^{-1} X^TV(λ)

V(λ)=1n(IA(λ))y2(1ntr(IA(λ)))2
A(λ)=X(XTX+nλI)1XT

另一方面,Efron 定义了与V(0) (p. 24) 相同的概念,但他将此概念的引入归因于 Craven & Wahba,其定义 (p. 377) 基本相同正如 Golub, Heath & Wahba 的上述定义。

这是否意味着0最小化V(λ)

类似地,Golub、Heath 和 Wahba 将λ的 CV 估计值(第 217 页)定义为

P(λ)=1nk=1n([Xβ(k)(λ)]kyk)2

其中β(k)(λ)是估计值

β^(λ)=(XTX+nλI)1XTy

ββk个数据点yi被省略。

作者将 CV 估计(也称为 PRESS 估计)的引入归因于 Allen(“Allen's PRESS”,同上)。然而在 Allen 的论文中,PRESS 估计被定义为(第 126 页)为nP(0)(在 Efron 的文章中,它被定义为P(0) (p. 24))。

同样,这是否意味着0最小化P(λ)


  1. Allen, David M. 变量选择与数据分析之间的关系以及一种预测方法。技术计量学,卷。16,第 1 期(1974 年 2 月),第 125-127 页

  2. 克雷文,彼得和瓦巴,格蕾丝。使用样条函数平滑噪声数据。Numerische Mathematik 31, (1979), pp. 377-403

  3. 埃夫隆,布拉德利。Logistic 回归的表观错误率有多大偏差?技术报告编号 232.斯坦福大学统计系(1985年4月)

  4. Golub、Gene H.、Heath 和 Grace Wahba。广义交叉验证作为选择良好岭参数的方法。技术计量学,卷。21,第 2 期(1979 年 5 月),第 215-223 页

1个回答

我相信评论指向答案,但没有直言不讳。所以我会直言不讳。

这里引用的 V 公式特定于线性岭回归。他们没有说它与 PRESS 相同,他们说它是 PRESS 的旋转不变版本。“旋转不变”部分是使这一点泛化的原因。

Efron 的论文是关于逻辑回归的,专门针对这种情况进行定制的。如果您想查看这两种情况之间的数学翻译,那么适合阅读的书是 Elements of Statistical Learning, 2ed,作者 Hastie、Tibshirani 和 Freedman。他们在线免费提供该书:https ://web.stanford.edu/~hastie/Papers/ESLII.pdf 。关于 GCV 的另一篇有用的读物​​是 Simon Wood 的 Generalized Additive Models。他的治疗通常将 GCV 与回归和逻辑回归中的应用相结合。

如果您查看 ESL 书,第 244 页,您会看到基本相同的符号系统。他们将您拥有的大型矩阵产品称为 Smoother 矩阵(我会说它是 Hat 矩阵或近亲)。他们将 Smoother描述为从Syy^

y^=Sy

S可用于计算留一个 CV 值,数据中的每一行一个。对于线性模型矩阵在回归诊断中起到 Hat 矩阵的作用。然而,他们说这可能在计算上具有挑战性或没有必要解决这个问题,而 GCV 方法是相同想法的稍微更通用的版本。S

他们提供了一个近似GCV 的公式:

GCV(f^)=1Ni=1N[yif^(xi)1trace(S)/N]2

这在许多模型中的行为与 AIC 非常相似。是参数的有效数量traceS

您引用的片段通常是的痕迹。据我所知,抽象的 GCV 是留一法交叉验证的近似版本,但在某些情况下(我相信岭回归),它是准确的。这是 Golub 论文中的一个要点。nλS

祝你好运,如果你了解更多,请回信。