构建多元输出的区间估计

机器算法验证 置信区间 多元分析 高斯过程
2022-04-02 13:27:11

我正在构建一个多元高斯过程模型,该模型从输入位置最后,我希望能够根据我知道绘制我对XiYiziXiYi

(XiYi)N2((μXiμYi),(σ11iσ12iσ21iσ22i))
如您所见,每个对都有自己的均值和协方差矩阵。现在,为了绘制我对的最佳估计,我可以简单地绘制我对的预测值对(如下所示的红线)。现在我的问题是,以下列方式构建 95% 区间估计是否合适(或者是否有更好的方法)。所以对于每个点Xi,YiXiYiXiYiXi,Yi我可以绘制它的 95% 置信椭圆,如下图所示(蓝色椭圆)

在此处输入图像描述

还有一点,我可以做类似的事情。

在此处输入图像描述

对于第三点,我可以再次做同样的事情,我们看到这里的协方差矩阵对于这组XiYi 在此处输入图像描述

在此处输入图像描述

在此处输入图像描述

所以最后我们看到我们可以为每个单点绘制一个 95% 的区间估计(最后两个图,其中倒数第二个图对所有点具有相同的协方差矩阵,最后一个图具有不同的协方差矩阵对于所有点)。现在,我可以认为这是所有点的 95% 联合区间,还是有更好的方法来解决这个问题?XiYiXiYi

1个回答

[我知道这不能回答问题,也不能提供消息来源;这将是一个评论,但太长了]

我认为您的问题是您没有明确定义“95%置信区间”,并且您的问题呈现出不止一种解释方式。如果您确切地确定“95% 置信区间”的含义,您可能会回答您自己的问题。

例如,您的意思是:

  1. 如果我多次重新运行我的实验,那么生成的 95% 的区域将完全包含真实路径

  2. 如果我多次重新运行我的实验,这些区域平均会包含 95% 的真实点

  3. 如果我多次重新运行我的实验,那么对于任何给定的真,对应的真将有95% 的时间XiYiXi
  4. 如果我多次重新运行我的实验,那么对于任何给定的真,对应的真将有95% 的时间区域对面的水平区域中。YiXiYi
  5. 随机选取的点的后验概率密度的 95% 的区域。这可能最接近您生成的内容。i

或者也许是其他一些变化。

您的问题是您的估计严格来说是所有对的一个非常高维的向量,因此您的“标准”置信区域将是一个高维椭圆体。请记住,过程中每个点的不确定性不必独立于前面的点,如果一个步骤太高,下一步可能也是如此。因为这是一个高斯过程,您应该能够计算出完整的 2N x 2N 相关矩阵,因此您可以根据您的兴趣来处理许多不同的置信区域。(Xi,Yi)