如果我有一个多元正态 iid 样本,并定义的马氏距离 [平方],使用矩阵进行加权),的分布是什么(马氏距离到样本均值使用样本协方差矩阵 )?
我正在看一篇声称它是的论文,但这显然是错误的:使用(未知)总体平均向量分布和协方差矩阵。当插入样本类似物时,应该得到一个 Hotelling分布,或一个缩放的分布,或类似的东西,但不是。我在Muirhead (2005)、Anderson (2003)和Mardia, Kent and Bibby (1979, 2003)中都找不到确切的结果. 显然,这些人并没有为异常值诊断而烦恼,因为多元正态分布是完美的,并且每次收集多元数据时都很容易获得:-/。
事情可能比这更复杂。Hotelling分布结果是基于假设向量部分和矩阵部分之间的独立性;这种独立性适用于和,但不再适用于和。