ZCA白化中如何选择正则化参数?

机器算法验证 主成分分析 数据转换 正则化
2022-04-09 01:14:39

ZCA 白化可以使用正则化,

X~=L(D+ϵ)1L1X,

其中是样本协方差矩阵的特征分解。有什么好的选择LDLϵ

进行非正则化 ZCA 白化X

X~=LD1L1X

然后选择以最小化此类保留白化数据与使用使用训练数据开发的正则化 ZCA 美白的保留数据之间的差异:ϵ

Y~(ϵ)=L(D+ϵ)1L1X

ϵ=argminY~(ϵ)X~

我想知道是否有更简单或更原则的方法来选择ϵ或一般化 PCA/ZCA。

1个回答

如果数据是均值为且协方差未知并且我们上放置一个逆维夏特先验验期望 其中是数据点的数量,是数据的维度。选择,例如,我们会得到 0ΣΣ

ΣW1(Ψ,ν),xN(0,Σ),
Σ
XX+Ψn+νp1,
npΨ=Iν=p+1
XX+In=C+1nI=L(D+1nI)L,
其中的明智选择可能是C=XX/nϵ1/n

您可以更进一步,使用正态逆Wishart先验正确估计协方差,即,也考虑均值的不确定性。后验的推导可以在(Murphy, 2007)中找到。