在狄利克雷分布中将单纯形表示为三角形表面的含义?

机器算法验证 分布 数据可视化 狄利克雷分布
2022-03-12 15:13:41

我正在阅读一本介绍 Dirchilet 分布的书,然后介绍了有关它的数据。但我并不能真正理解这些数字。我在底部附上了这个数字。我不明白的是三角形的含义。

通常,当一个人想要绘制一个包含 2 个变量的函数时,您会获取 var1 和 va2 的值,然后绘制这两个变量的函数值的值……这会在 3D 维度上给出可视化。但是这里的函数值有 3 个维度和一个其他值,因此它可以在 4D 空间中进行可视化。我看不懂那些数字!

我希望有人可以澄清他们!

编辑:这是我从图 2.14a 中无法理解的内容。所以我们从 K=3 dirichlet 中得出了一个样本 theta(基本上是一个向量),即:theta = [theta1, theta2, theta3]。三角形绘制 [theta1, theta2, theta3]。从原点到每个 theta_i 的距离就是 theta_i 的值。然后对于每个 theta_i 它放置一个顶点并连接所有三个顶点并制作一个三角形。我知道如果我将 [theta1, theta2, theta3] 插入 dir(theta|a) 我会得到一个数字,它是向量 theta 的联合概率。我也明白连续随机变量的概率是一个区域的度量。但是这里我们有 3 个维度,所以联合概率将是从粉红色平面到下面的空间体积的量度......即金字塔。现在我不明白三角形在这里的作用是什么。

在此处输入图像描述

2个回答

我不明白三角形在这里的作用是什么。它试图传达或想象什么?

三角形中的所有点必须满足两个约束:每个维度中的零和一之间()并且所有点的总和为一()。0θ1θ0+θ1+θ2=1

我最终理解它的方式如下:

数字

所以 (a) 显示了一个以为坐标的 3-D 空间。它们的范围仅在 0 和 1 之间。θ1,2,3

在(b)中,显示了一个三角形,这是我们的单纯形。

(c) 显示了两个“位于”单纯形上的示例点,它们也满足第二个标准(总和为一个)。

(d) 显示了单纯形上的另一个示例点,相同的约束成立

在 (e) 中,我尝试将单纯形投影到二维三角形中,并显示所有示例点。

希望现在更有意义:)

图 2.14(a) 显示了由每个轴上的三个顶点构成的平面。顶点到原点的距离是,对应于类之一。粉红色平面和轴平面包围的区域是 (vector)θik=3θ. 现在假设你倾斜那个平面,这样你就有一个带有粉红色平面的金字塔,离读者最近的面,平放在页面上。然后抑制页面中“弹出”的第三个维度,而是为三角形着色,以便从底部到表面的距离更长的高密度区域更红。这就是图 2.14(b) 和 2.14(c) 显示的内容。红色越集中在顶点附近,与该顶点相关联的类的可能性就越大。同样,如果红色区域不是非常靠近任何顶点,则事件不太可能具有更高的任何类别成员资格的概率。

然而,这个金字塔仅作为狄利克雷分布的单一实现才有意义。从相同的分布再次绘制可能会产生一个不同的金字塔,每个顶点的(a) 和 (b)/(c) 之间的主要区别在于 (a) 以图形方式显示了一次绘制向量的概率。图 (b) 和 (c) 显示了 k=3 单纯形中值 \theta 的概率密度它们试图呈现所有值θθθk=3θ在支持。考虑 (b) 和 (c) 的一种方法是根据平粉色平面和金字塔表面之间的平均高度,将其视为具有额外红色的点,该点在θDir(α)