高斯过程模型的主要优点

机器算法验证 高斯过程
2022-03-04 04:58:35

高斯过程已被广泛使用,尤其是在仿真中。众所周知,计算需求很高()。0(n3)

  1. 是什么让它们受欢迎?
  2. 它们的主要优势和隐藏优势是什么?
  3. 为什么使用它们而不是参数模型(参数模型是指典型的线性回归,其中可以使用不同的参数形式来描述输入与输出趋势;例如,qaudratic)?

我真的很感激一个技术答案,解释使高斯过程独特和有利的固有属性

3个回答

从工程的角度来看,主要优点是(正如@Alexey 提到的)。在广泛使用的克里金方法中,您可以通过为取决于距离和方向的关系提供“相关”(或协方差)模型(通常称为变异函数椭圆体)来解释自己的“空间” 。

没有什么可以阻止其他方法具有相同的特征,只是碰巧克里金法最初被概念化的方式对非统计学家的人来说是一种友好的方法。

如今,随着基于地质统计学的随机方法的兴起,例如顺序高斯模拟等,这些程序正被用于定义不确定性空间(可能需要数千到数百万维)很重要的领域。同样,从工程的角度来看,基于地质统计学的算法很容易包含在遗传编程中。因此,当您遇到逆问题时,您需要能够测试多个场景并测试它们对优化函数的适应性。

让我们暂时搁置纯粹的论证,为这种用法的现代真实示例陈述事实。您可以直接对地下样本进行采样(硬数据),也可以制作地下地震图(软数据)。

在硬数据中,您可以直接测量属性(比如说声阻抗)而不会出现(ish)错误。问题是这是稀缺的(而且很昂贵)。另一方面,你有地震映射,它实际上是地下的体积、像素级的映射,但不会给你声阻抗。为简单起见,假设它为您提供了两个声阻抗值(顶部和底部)之间的比率。因此,0.5 的比率可能是 1000/2000 或 10 000/ 20 000 的除法。这是一个多重解决方案空间,可以进行多种组合,但只有一种能够准确地代表现实。你如何解决这个问题?

地震反演的工作方式(随机程序)是通过产生合理的(这是另一个故事)声阻抗(或其他属性)场景,将这些场景转换为合成地震(如前面示例中的比率)和将合成地震与真实地震进行比较(相关性)。最好的场景将被用来产生更多的场景,汇聚成一个解决方案(这并不像看起来那么容易)。

考虑到这一点并从可用性的角度讲,我将通过以下方式回答您的问题:

1) 使它们流行的原因是可用性、实施的灵活性、大量的研究中心和机构不断为几个不同的领域(特别是地球科学,包括 GIS)制作更新和更具适应性的基于高斯的程序。

2) 主要优点是,如前所述,从我的角度来看,可用性和灵活性。如果它易于操作且易于使用,您就去做。高斯过程中没有在其他方法(统计或其他方法)中不可重现的特定特征。

3) 您需要在模型中包含更多信息而不仅仅是数据时使用它们(例如具有空间关系、统计分布等的信息......)。我可以保证,如果您有大量具有各向同性行为的数据,则使用克里金法是浪费时间。您可以使用任何其他方法获得相同的结果,这些方法需要的信息更少,运行速度更快。

对于工程师来说很重要:

  • 有预测的置信区间
  • 插入训练数据
  • 拥有平滑和非线性模型
  • 使用获得的回归模型进行自适应实验设计和优化

高斯过程满足所有这些要求。

此外,工程和地质统计学数据集通常不是那么大,或者具有允许快速推断的特定网格结构。

高斯模型的优点。

高斯 PDF 仅取决于其一阶和二阶矩。广义平稳高斯过程也是严格平稳过程,反之亦然。

高斯 PDF 可以模拟许多过程的分布,包括一些重要的信号和噪声类别。许多独立随机过程的总和具有高斯分布(中心极限定理)。

非高斯过程可以通过多个具有适当均值和方差的高斯 pdf 的加权组合(即混合)来近似。

基于高斯模型的最佳估计方法通常会产生线性和数学上易于处理的解决方案。