我有个数据集,每个数据集都有个变量和个样本(它们实际上是 EEG 时间序列,但我丢弃时间并将它们视为 iid 多元样本)并假设它们来自相同的多元正态分布。
我有兴趣估计协方差矩阵。现在可以通过两种方式完成:
- 将数据集连接在一起,并计算协方差矩阵。考虑到样本的多正态性假设,它的抽样分布将是 Wishart。
- 分别计算每个数据集的协方差,并对这些矩阵(算术平均值)进行平均以形成一个总协方差。
第一种方法很简单,并且具有良好的特性,但第二种方法在大多数情况下在我的环境中更可行。
根据 Wishart 分布的方差性质 SE 的协方差矩阵的元素等于和 CLT(中心极限定理)我可以看到,协方差矩阵估计的期望值和标准误差对于这两种方法都应该一致。
但是,(显然)这些方法不会在数值上产生相同的协方差。
- 估计协方差矩阵的两种方法都具有相同的标准误差,这是真的吗?
- 当样本量参数趋于无穷大时(就像我们对卡方分布所做的那样),Wishart 分布行为是否可以通过正态分布来近似?如果是这样,具有相当好的近似值的条件是什么?
- 我敢打赌,如果可以用正态分布来近似 Wishart 分布的矩阵元素,那么第二种方法的有效性取决于这种近似的有效性。但是,如果我错了,有人可以纠正我吗?
算法的某些联合对角化性能的文章中可互换使用两个估计器。