边际分布和联合分布的模式数量如何相关?

机器算法验证 分布 边际分布 模式
2022-03-13 00:56:05

单峰多元分布可以具有多峰边际分布吗?

如果所有边际分布都是单峰的,那么多元分布可以是多峰的吗?

2个回答

从单峰边缘创建多峰双变量分布的一种方法是使用混合。这个想法是,正态分布的混合可以是单峰的,但相同正态的双变量版本可以具有不同的峰值,只要它们适当相关。

作为一个具体的例子,让f是两个二元正态分布的等量混合。两者都有单位方差和相同的相关性ρ,但让他们的手段(a,a)(a,a)对于一些a0. 假如a1,的边缘f(它们是两个单位方差法线的相同混合)将只有一个模式,但是如果我们使ρ足够接近1,f将明显是双峰的。例如,这里有一个等高线和曲面图f为了a=1/2ρ=4/5

图1

共同边际没有两种模式的暗示:

图 2

这里说明的一般技术显示了多元分布的合适选择的混合物如何使边际齐平滑,从而使它们仅是单峰。在创建多变量数据的核密度估计时,我们总是会看到这类事情:密度估计具有数据集群的模式,但边缘可能是单峰的,因为集群不会沿着任何组件方向对齐。


为了解决第二个问题,请注意即使是所有边际都是标准正态的分布仍然可以是多峰的。

作为一个具体的例子,让f是具有均值的双变量正态分布的 PDF(0,0)、单位方差和相关性ρ. 定义

g(x,y)={f(y,x)1<x<1 and 1<y<1f(x,y)otherwise.

这会旋转图形g广场内(1,1)×(1,1)90 度。因为边缘f相同且对称0,g具有相同的边际f. 然而,g显然有三种模式——在(0,0),(1,1), 和(1,1)- 作为这个等高线图(与ρ=4/5) 显示:

图 3

此示例说明了回答有关模式的问题的一般技术:从 PDF 中剪切并移动它们。

是的,是的,例子很容易设计。

(X,Y)具有离散分布

  • 概率质量0.12(0,0)0.084积分(±1,±1).

  • 概率质量0.07在每个(±2,±2)(±3,±3).

这是一个单峰双变量分布,其众数为0.12(0,0) 然而,边际分布是

3210+1+2+30.140.140.160.120.160.140.14

与双峰0.16±1最不可能的值0双变量分布的模式在哪里!


作为单峰边际分布但多峰联合分布的示例,请考虑随机变量XY 具有相同的单峰边际分布

210+1+20.050.20.50.20.05

和具有质量的双变量分布0.2(0,1),(1,0),(0,1),(1,0)和大量0.05(0,2),(2,0),(0,2),(2,0)其中有 4模式。