我想从整数中采样有概率,替换,直到我看到不同的元素(称之为次)。
您可以将我要从中采样的分布查看为多项分布,而不是固定样本数, 让是第一个给出确切的数字-稀疏向量。(或者,给出的最大数-稀疏向量也可以。)
使用别名方法,按照上面所写的字面意思实现采样需要时间。
所以,这是否有效运行取决于有多大是。如果概率相对一致和/或,这应该不会太糟糕。但在病理情况下和其中的两个s 非常小,这需要很长时间。
这是优惠券收集器问题的一个版本,我发现了不统一的变体,但我没有找到你只需要得到的优惠券的种类——无论如何,我不知道这种推理是否有助于更有效的抽样算法。
所以:
- 你能找到,或绑定,分布? 特别是在或类似的?
- 是否有更有效的算法来执行此采样?