我对使用成对协方差矩阵估计器处理 OLS 中缺失的协变量数据重新产生了兴趣,即在计算方差和协方差时使用所有可用的变量对。这要归功于最近的一篇论文:http ://heather.cs.ucdavis.edu/Missing.pdf 。“使用所有可用的对”方法比对大型数据集的多重插补要快得多。
在决定如何进行计算时,有几种可能的排列
- 数据是否居中并在事后估计截距(如上述论文中所做的那样)与同时估计所有斜率的截距(这更容易处理)
- 是否在 demoninators 中使用而不是
和X'Y 时使用原始数据建立计算,然后使用标准其中包括一列 s 用于截距. 这种方法更通用,可以用于其他模型,例如逻辑。
有谁知道一种方法优于其他全对方法的原因?换句话说,最好的全对方法的细节是什么?