多元正态分布密度函数:如果行列式为零,值是多少?

机器算法验证 多元正态分布
2022-03-24 16:24:02

给定一个计算多元正态分布的函数,如果协方差矩阵的行列式为零,应该返回什么值?如果是这种情况,这意味着什么?

编辑(我希望这更清楚):

我有假设由 MVN 分布描述的数据。

在此处输入图像描述

现在我想总结一下数据的结果以获得可能性。

3个回答

函数的返回值

如果您想为计算多元正态分布的函数编写代码,那么,如果 var-covar 的行列式为零,则此返回值未定义,因为 var-covar 矩阵是奇异的(逆不存在)。

如果 var-covar 矩阵是奇异的,则函数的最佳返回值可能是 NA。

奇异 var-covar 矩阵的原因

奇点的原因可能是您的“变量”之一(与)一样好,因此其方差(几乎)为零,或者也可能是您的变量之一是其他变量的线性组合。

假设指定的协方差矩阵为 n × n,即多元正态随机变量 X 为 n 维。Det(covariance matrix) = 0 当且仅当协方差矩阵是奇异的。如果协方差矩阵是奇异的,则 X 没有密度。可能存在 X 集中的低维空间(流形),使得该低维空间中的协方差矩阵是非奇异的,在这种情况下,当投影到该低维空间时,X 将具有密度。

编辑:关于上面 whuber 的评论,根据线程标题,我假设 OP 想知道(如何计算)密度。累积概率分布确实存在,即使协方差矩阵是奇异的(行列式 = 0),并且可以通过积分低维密度来计算。我相信不可能存在 X 集中在其上且具有非奇异协方差的低维流形的唯一方法是,如果 X 集中在单个点(例如,方差 = 0 的一维法线),那么对于包含该点的任何区域,累积分布 = 1,否则为 0。

实际上它也可以通过使用广义逆和“伪行列式”来定义。

解决方案不是唯一的。