具有不精确/随机内核评估的 Nystrom 近似

机器算法验证 降维 内核技巧 线性代数 近似
2022-04-03 22:45:42

假设我们有几个数据点x1,,xmRn以及一个正定核K(x,y):Rn×RnR可以写成形式

K(x,y)=EθP(θ)[ϕθ(x)ϕθ(y)].
也就是说,我们认为ϕθ:RnRp作为一个将点提升到特征空间的函数(类似于任何内核),但我们平均了很多ϕ的参数化为θ. 可以用这种方式编写随机傅立叶特征和几个内核。

我可以近似一个给定的条目Kij:=K(xi,xj)我的内核矩阵的样本均值Q要点:

Kij1Qq=1Qϕθq(xi)ϕθq(xj),
在哪里θ1,,θqP(θ).

假设我计算RKRm×m使用上面的期望;我可以画一组不同的θ的每个(i,j)一对。然后,我填写剩余的mR使用Nystrom 近似或一些正则化变体的行。我的近似误差Kij矩阵来自两个来源: 评估K(,)使用抽样方法,并使用低秩假设填充缺失的行。

有没有办法理解之间的权衡QR这里? 也就是说,为了提高我对全核矩阵的近似质量,我应该增加样本数量吗?Q或行数R?

0个回答
没有发现任何回复~