我试图了解为一组缺少数据条目(或 NaN)的观察估计协方差矩阵背后的数学。
我想这样做而不删除缺少条目的行或不使用事后平滑来确保协方差矩阵是半正定的。我该怎么做?
我知道一种方法是插补(缺失数据和协变量分析),但还有其他方法。非常感谢您的任何见解!
我试图了解为一组缺少数据条目(或 NaN)的观察估计协方差矩阵背后的数学。
我想这样做而不删除缺少条目的行或不使用事后平滑来确保协方差矩阵是半正定的。我该怎么做?
我知道一种方法是插补(缺失数据和协变量分析),但还有其他方法。非常感谢您的任何见解!
另一种方法是在给定所有观察数据的情况下计算最大似然均值和协方差矩阵。这需要一个迭代算法,例如期望最大化算法。也存在加速变体和其他类型的优化算法。与插补相比,这种方法可以生成更有效且在更广泛的设置下无偏的估计器。它确实要求数据的缺失与缺失值无关(即数据是“完全随机缺失”或“随机缺失”)。
参考:
Jamshidian 和本特勒 (1999)。使用完整数据例程对缺失数据的均值和协方差结构进行 ML 估计。
利特尔和鲁宾 (1987)。缺失数据的统计分析。[特别是第 8 章]