以不同项目数为条件的多项分布

机器算法验证 可能性 分布 采样 多项分布 优惠券收集问题
2022-03-27 18:09:16

我想从整数中采样{1,,k}有概率{pi}i=1k,替换,直到我看到m不同的元素(称之为n次)。

您可以将我要从中采样的分布查看为多项分布,而不是固定样本数n, 让n是第一个给出确切的数字m-稀疏向量。(或者,给出的最大数m-稀疏向量也可以。)

使用别名方法,按照上面所写的字面意思实现采样需要O(n+k)时间。

所以,这是否有效运行取决于有多大n是。如果概率相对一致和/或km,这应该不会太糟糕。但在病理情况下k=m+1和其中的两个pis 非常小,这需要很长时间。

这是优惠券收集器问题的一个版本,我发现了不统一的变体,但我没有找到你只需要得到的m<k优惠券的种类——无论如何,我不知道这种推理是否有助于更有效的抽样算法。

所以:

  • 你能找到,或绑定,分布n? 特别是在maxpi/minpi或类似的?
  • 是否有更有效的算法来执行此采样?
0个回答
没有发现任何回复~