为什么边际分布/边际概率被描述为“边际”?

机器算法验证 可能性 术语
2022-02-01 19:15:54

边际通常指的是影响很小的东西,是在更大系统之外的东西。它倾向于降低任何被描述为“边缘”的东西的重要性。

那么这如何适用于随机变量子集的概率呢?

假设单词因其含义而被使用在数学中可能是一个冒险的命题,所以我知道这里不一定有答案,但有时这类问题的答案可以帮助你获得真正的洞察力,因此为什么我'我问。

2个回答

考虑下表(从本网站复制)代表掷两个骰子结果的联合概率:

两个模具卷

在这种显示分布的常见且自然的方式中,单个骰子的结果的边际概率按字面意思写在表格的边缘(突出显示的行/列)。

当然,我们不能真正为连续随机变量构建这样的表,但无论如何我猜这就是该术语的起源。

为了补充 Jake Westfall 的答案(https://stats.stackexchange.com/q/408410),我们可以将边际密度视为整合其他变量。详细地说,如果我们有(X,Y)是两个随机变量,那么密度Xx

p(x)=p(x,y)dy=p(x|y)p(y)dy,
当变量是离散的,例如,如果XY只取值1,,6,然后找到概率
p(X=1)=y=16p(X=1,Y=y)
这与对第一行中的元素求和相同(i=1) 他的桌子。

我认为从情节的角度来看这个更容易。下面是从两个高斯混合采样时的联合密度图,边缘XY分别在顶部和右侧

具有平滑密度的相同图(您可以将其视为相同但具有XY现在是连续的,在这种情况下你仍然可以找到边际,但我们将使用积分而不是求和)

这两个图都是使用 seaborn ( https://seaborn.pydata.org/generated/seaborn.jointplot.html#seaborn.jointplot ) 的联合图函数生成的。

希望这可以帮助!