假设我们有几个数据点以及一个正定核可以写成形式
也就是说,我们认为作为一个将点提升到特征空间的函数(类似于任何内核),但我们平均了很多的参数化为. 可以用这种方式编写随机傅立叶特征和几个内核。
我可以近似一个给定的条目我的内核矩阵的样本均值要点:
在哪里.
假设我计算行使用上面的期望;我可以画一组不同的的每个一对。然后,我填写剩余的使用Nystrom 近似或一些正则化变体的行。我的近似误差矩阵来自两个来源: 评估使用抽样方法,并使用低秩假设填充缺失的行。
有没有办法理解之间的权衡和这里? 也就是说,为了提高我对全核矩阵的近似质量,我应该增加样本数量吗?或行数?