单峰多元分布可以具有多峰边际分布吗?
如果所有边际分布都是单峰的,那么多元分布可以是多峰的吗?
单峰多元分布可以具有多峰边际分布吗?
如果所有边际分布都是单峰的,那么多元分布可以是多峰的吗?
从单峰边缘创建多峰双变量分布的一种方法是使用混合。这个想法是,正态分布的混合可以是单峰的,但相同正态的双变量版本可以具有不同的峰值,只要它们适当相关。
作为一个具体的例子,让是两个二元正态分布的等量混合。两者都有单位方差和相同的相关性,但让他们的手段和对于一些. 假如的边缘(它们是两个单位方差法线的相同混合)将只有一个模式,但是如果我们使足够接近,将明显是双峰的。例如,这里有一个等高线和曲面图为了和:
共同边际没有两种模式的暗示:
这里说明的一般技术显示了多元分布的合适选择的混合物如何使边际齐平滑,从而使它们仅是单峰。在创建多变量数据的核密度估计时,我们总是会看到这类事情:密度估计具有数据集群的模式,但边缘可能是单峰的,因为集群不会沿着任何组件方向对齐。
为了解决第二个问题,请注意即使是所有边际都是标准正态的分布仍然可以是多峰的。
作为一个具体的例子,让是具有均值的双变量正态分布的 PDF、单位方差和相关性. 定义
这会旋转图形广场内90 度。因为边缘相同且对称,具有相同的边际. 然而,显然有三种模式——在,, 和- 作为这个等高线图(与) 显示:
此示例说明了回答有关模式的问题的一般技术:从 PDF 中剪切并移动它们。
是的,是的,例子很容易设计。
让具有离散分布
概率质量在和在积分.
概率质量在每个和.
这是一个单峰双变量分布,其众数为在 然而,边际分布是
与双峰在和最不可能的值双变量分布的模式在哪里!
作为单峰边际分布但多峰联合分布的示例,请考虑随机变量和 具有相同的单峰边际分布
和具有质量的双变量分布在和大量在其中有 模式。