重建统计数据x ⊗ yx⊗y来自 E[XX']、E[YY'] 和 E[XY']

计算科学 统计数据
2021-12-05 05:10:14

我在看随机向量z大小的d2可以写成z=xy在哪里x,y是随机向量Rd已知以下第二个时刻-E[XX],E[YY]E[XY]. 第一时刻为 0。

给定一个新向量z^=x^y^,我需要将其除以协方差矩阵z,这需要从上面的 3 个矩矩阵中估计出来。如果E[XY]为零,则除法很简单

cov(z)1z^=E[XX]1x^E[YY]1y^

但是,就我而言E[XY]不为 0,这个估计会产生错误。是否有一些系统的方法来整合E[XY]纠正这个?

1个回答

(从我的评论转换为答案并扩展。)

基本上你需要计算第四个时刻E[xixjykyl]对所有人i,j,k,l,给定第二个时刻。这些第四个时刻并不是普遍确定的,但它们取决于变量的分布,即使在一维情况下也是如此(这正是峰度成为问题的原因)。(特别是,如果xy相关但不独立,我强烈怀疑即使是您的案例公式E[xy]=0是错误的,因为您似乎是使用独立性得出的。)

但是,由于您要求的是近似值,因此并非所有内容都丢失了。您可以在以下假设下计算该表达式的值xy是高斯的;即使它们不是,如果它们的分布不是太极端,希望它可以作为真实协方差的合理近似值。

对于高斯变量,结果由Isserlis 定理给出

cov(xy)di+k,dj+l=E[xixjykyl]=E[xixj]E[ykyl]+E[xiyk]E[xjyl]+E[xiyl]E[xjyk].
如果你设置cov(x)=V,cov(y)=W, 那么第一个和给出矩阵VW你已经找到了;第二个给出秩 1 矩阵vec(V)vec(W),我没有立即看到第三个很好的表达方式。您可以轻松计算所有矩阵条目,但我没有立即看到任何线性代数技巧通过将其减少为n×n矩阵,因为它发生在您的特殊情况下。