了解多项分布

机器算法验证 可能性 分布 数理统计 多项分布
2022-04-19 12:08:08

有K个类别。令 x 为取值的离散随机变量1,2...,K. 给定数据X={x1,x2,...,xN}, 并假设p是一个向量概率,其中,p(x=k)=pk.

通常,我们会看到以下内容:

  1. 认为Nk=iI(xi=k),即计数结果 k 在 n 次试验中出现的次数。我们对计数集进行建模Nk作为多项分布。

p(N1...Nk|p)=N!N1!...NK!k=1KpkNk

这是我们平时看到的。

但是,我在网上遇到了一些有趣的事情,我的问题如下:以下可以是多项分布吗?为什么?

如果我们建模怎么办X作为多项分布。

p(X|p)=k=1KpkNk

它仍然是多项分布的有效 pmf 吗?起初,我认为这是不可能的,因为它缺乏排列,这是使 pmf 总和为 1 的归一化常数。但研究论文表明这两者都是多项分布,尽管它们建模不同的事物。

1个回答

假设你掷出一个 6 面骰子N次。

滚动的结果i,i=1,,N, 由随机变量表示Xi. 元组X=(X1,,XN)包含每次滚动的结果。

我们可以从X通过采取Nj=i=1Nδ(Xi=j),j=1,,6. 元组N=(N1,,N6)包含每个类别的计数。

拥有和拥有有什么区别XN? 它们都起源于N具有六种可能结果的多项分布的试验,每种结果的发生概率相同。然而,当我们讨论概率时X我们谈论的是特定结果序列的概率。当我们讨论概率时N我们谈论的是一组特定计数的概率。试验级信息有一个标准化因素,但它只是1因为只有一种方法可以获得任何特定的结果序列。

编辑论文的第二部分实际上讨论了何时使用计数以及何时使用样本。