假设我混合了有限多个具有已知权重、均值和标准差的高斯分布。手段不均等。当然,可以计算混合物的平均值和标准差,因为矩是分量矩的加权平均值。混合不是正态分布,但它离正态有多远?
上图显示了高斯混合的概率密度,其分量均值由(组件的)标准偏差和具有相同均值和方差的单个高斯。
这里的手段是分开的标准偏差,并且很难通过肉眼将混合物与高斯分开。
动机:我不同意一些懒惰的人关于他们没有测量的一些实际分布,他们认为这些分布接近正常,因为那会很好。我也很懒 我也不想测量分布。我想说他们的假设是不一致的,因为他们说具有不同均值的高斯的有限混合是不正确的高斯。我不只是想说尾巴的渐近形状是错误的,因为这些只是近似值,只能在平均值的几个标准偏差内合理准确。我想说的是,如果成分与正态分布非常接近,那么混合物就不是,我希望能够对此进行量化。
我不知道正常使用的正确距离:CDF 之间的差异的上限值,距离,推土机的距离,KL散度等。我很乐意根据这些或其他措施获得界限。我很高兴知道与混合的均值和标准差相同的高斯距离,或者任何高斯的最小距离。如果有帮助,您可以限制混合物是高斯使得较小的权重大于.