通过无限维基函数视图理解高斯过程回归

机器算法验证 高斯过程 内核技巧 基函数
2022-02-09 18:36:52

人们常说,高斯过程回归(GPR)对应于具有(可能)无限数量的基函数的贝叶斯线性回归。我目前正在尝试详细了解这一点,以了解我可以使用 GPR 表达什么样的模型。

  1. 您认为这是尝试理解 GPR 的好方法吗?

在《机器学习的高斯过程》一书中,拉斯穆森和威廉姆斯表明,由参数化指数平方核描述的高斯过程集

k(x,x;l)=σp2exp((xx)22l2)
可以等效地描述为具有先验信念的贝叶斯回归wN(0,σp2I)形式的权重和无限量的基函数
ϕc(x;l)=exp((xc)22l2)
因此,内核的参数化可以完全转化为基函数的参数化。

  1. 可微内核的参数化是否总是可以转化为先验函数和基函数的参数化,或者是否存在可微内核,例如基函数的数量取决于配置?

到目前为止,我的理解是,对于一个固定的核函数 k(x,x'),默瑟定理告诉我们k(x,x)可以表示为

k(x,x)=i=1λiϕi(x)ϕi(x)
在哪里ϕi是实数或复数的函数。因此,对于给定的内核,相应的贝叶斯回归模型具有先验wN(0,diag([λ12,]))和基函数ϕi. 因此,每个 GP 甚至可以被表述为具有对角先验的贝叶斯线性回归模型。但是,如果我们现在对参数化内核的每个配置都使用 mercers 定理k(x,x,θ)是可微分的θ对于每种配置,相应的特征值和特征函数可能会有所不同。

我的下一个问题是关于默瑟斯定理的逆。

  1. 哪些基函数集导致有效内核?

和扩展

  1. 哪些参数化基函数集导致有效的可微核?
1个回答

这里有几点意见。也许其他人可以填写详细信息。

1)基表示总是一个好主意。如果你想用你的协方差函数实际做一些计算,很难避免它们。基础扩展可以为您提供内核的近似值以及可以使用的东西。希望你能找到一个对你试图解决的问题有意义的基础。

2)我不太确定这个问题中的配置是什么意思。至少有一个基函数需要是θ内核依赖θ. 所以是的,特征函数会随参数而变化。它们也会随着不同的参数化而变化。

通常,基函数的数量将(可数地)无限,因此该数量不会随参数而变化,除非某些值导致内核退化。

我也不明白你在第 2 点中关于具有贝叶斯先验的过程的意思wN(0,diag[λ12,])自从w直到现在才被提及。还,diag[λ12,]似乎是一个无限维矩阵,我对此有疑问。

3) 哪一组基函数形成有效的内核?如果您正在考虑特征基,那么函数需要在某些度量上是正交的。有两个问题。1)生成的内核必须是正定的......如果λi是积极的。2)扩展必须收敛。这将取决于λi,这需要足够快的衰减以确保表达式的收敛。收敛也将取决于域x

如果基函数不是正交的,则更难证明从它们定义的协方差是正定的。显然,在这种情况下,您不是在处理特征展开,而是在使用其他近似感兴趣函数的方法。

但是,我认为人们通常不会从一堆函数开始,然后尝试从它们构建协方差内核。

RE:内核的可微性和基函数的可微性。我实际上并不知道这个问题的答案,但我会提供以下观察。

泛函分析通过通过更简单函数的有限和来逼近函数(从无限维空间)来进行。要完成这项工作,一切都取决于所涉及的收敛类型。通常,如果您正在研究一个对感兴趣的函数具有强收敛性(一致收敛性或绝对可和性)的紧集,那么您会得到您正在寻找的那种直观结果:简单函数的属性传递给极限函数——例如,如果内核是参数的可微函数,则展开函数必须是相同参数的可微函数,反之亦然。在较弱的收敛特性或非紧域下,这不会发生。根据我的经验,每个人提出的每个“合理”想法都有一个反例。

注意:为了防止这个问题的读者可能产生混淆,请注意点 1 的高斯展开不是点 2 的特征展开的示例。