很大程度上取决于异常值在模型中的确切位置——在指标中?潜变量及其测量误差?在外生变量中,在因果链的顶端?在前一种情况下,您不能做太多事情,因为您确实拥有高杠杆影响的案例而不是异常值。要控制指标/响应变量中的异常值,您需要像Moustaki 和 Victoria-Feser (2006)那样在方程级别工作。使用稳健的协方差矩阵对其进行射击可能是正确的做法,也可能不是正确的做法。我在这里指的是巴黎圣母院的 Ke-Hai Yuan 和 Zhiyong Zhang 最近的工作,他们试图恢复应用于结构方程建模的稳健估计方法——例如,参见他们的 R 包rsem(这似乎依赖于将 EQS 作为估计引擎,考虑到 R 中的多种选择,这很奇怪)。在过去五年左右的时间里,他们一直在疯狂地发表这方面的文章;我已经为各种期刊审阅了至少三篇论文,坦率地说,我不知道该推荐哪一篇,因为它们都相互重复。我还没有看到这在应用工作中被大量使用,尽管它可能应该是;也许你会成为潮流引领者!
一个很好的诊断工具是由 LSE 的 Atkinson 和 Riani 开发的前向搜索方法(用于回归和多变量数据)。这已被 SEM here和here采用。我个人认为这真的很整洁,但它是否能赶上整个 SEM 社区,我不知道。
Frontiers in Quant Psy 在 2012 年初发表了一篇关于这方面的评论论文。尽管我是这部作品的公认审稿人,但我非常不愿意真正推荐它(它几乎没有超过我的可发表作品的门槛,我干脆放弃解释我的裁判信中的稳健统计理论),但我只是不知道有什么更好的。