特征值的收缩

机器算法验证 回归 估计 特征值 正则化 斯坦斯现象
2022-04-04 16:43:45

假设我们有样本 ,它们是独立同分布的,均值 = 0 ,未知非奇异协方差矩阵每个样本是一个大小为的向量。nX1,...,XnMXip×1

我想应用“Stein-Haff 估计器”[Stein, C. 1975],它通过缩小其特征值所以假设有特征值它的估计具有校正的特征值MMα1,α2,...,αpMα1,α2,...,αp

Stein-Haff 估计器的形式为Stein, C (1977b), Lecture 4 page 1391

                                                           αj=αj/Lj(α)

其中Lj(α)=n+p2j+1+2i>j(αi/(αjαi))2i<j(αj/(αiαj))

不幸的是,这个估计器不是很好,因为一些修正后的特征值可能是零甚至是负数。这就是为什么他们继续对上述方程应用“等渗回归”。有很多参考资料解释了这个估计器的等渗版本是如何完成的:

在此处输入图像描述

不幸的是,我无法获得前两个参考文献的 PDF。但是有人可以向我解释斯坦如何使用等渗回归修改他的估计器。那么上面等式的最终形式是什么?

非常感谢您的经验提供的任何帮助!

1个回答

首先,除了我在https://stat.duke.edu/~berger/papers/yang.pdf的几秒钟谷歌搜索中看到的之外,我对 Stein-Haff 估计器一无所知,其中包含引用“这个估计器有两个问题。首先,直观兼容的排序经常被违反。其次,更严重的是,一些甚至可能是负数。Stein 建议等渗算法来避免这些问题。...这种等渗算法的细节可以在 Lin 和 Perlman (1985) 中找到。ϕ1ϕ2ϕpϕi
该参考文献是:LIN, SP 和 PERLMAN,MD (1985)。协方差矩阵的四个估计量的蒙特卡罗比较。在多变量分析 6(PR Krishnaiah 编辑)411-429 中。北荷兰,阿姆斯特丹。

但是,我确实知道优化。等渗约束可以放在最小二乘问题上,使其成为(线性约束)凸二次规划(QP)问题,使用现成的软件很容易制定和数值求解。如果将 L^1 范数用于回归,或者甚至将 L^1 惩罚添加到 L^2 目标,那仍然是凸 QP。在目标仅为 L^1 的情况下,它实际上是一个线性规划 (LP) 问题,这是凸 QP 的一个特例。

至于负特征值,假设在加入等渗约束后仍然可能存在,可以通过对协方差矩阵施加半定约束来处理。即,施加最小特征值的约束。如果您愿意,您实际上可以设置一个除 0 以外的最小特征值,如果您想确保协方差矩阵是非奇异的,正如您所建议的那样,您需要这样做。这个半定约束的添加将整个优化问题变成了一个凸半定程序 (SDP),或者从技术上讲,可以转换成一个东西。0

制定和数值求解这样一个凸 SDP,即,您选择的范数是客观的(任何的 L^p ),加上您选择的范数中的任何客观惩罚,这些惩罚不需要相同作为另一个规范,加上等渗(线性)约束,加上半定约束,使用诸如 CVX http://cvxr.com/cvx/之类的工具非常容易和直接。这应该是非常快的执行,除非协方差矩阵的维度(你称之为 p,而不是我称之为 p)是数千或更大。YALMIP http://users.isy.liu.se/johanl/yalmip/p1(p1)可以用来代替 CVX(它只允许制定和解决凸优化问题,但整数约束的可选规范除外)。与 CVX 相比,YALMIP 允许更多的优化求解器选择和更大范围的问题(非凸)可以制定和解决,但学习曲线更陡峭。