我有 N 个桶,编号为 1 到 N。
我画了 k 个随机整数,均匀分布在 1 到 N 的范围内,有放回,并且对于每个整数,我将一个球放入相应的桶中。k 可以是任意大小;具体来说,它可以是从 2 到 N 的任何值,或者大于 N。
- 最后每个桶中球数的统计特征(概率分布等)是什么?
- 0,1,...k个球的桶数的统计特征是什么?
这个问题源于需要衡量散列算法的“好”(在某种意义上)。给定一个桶之间密钥分布的样本,我需要衡量它在“非常好”到“非常糟糕”的范围内的位置,并且能够计算出诸如“超过 x 的机会是多少”给定 k 和 N 的桶中的球?
显然,从我写这篇文章的方式来看,从我分配给变量的随机名称来看,我绝对没有统计上的复杂性。请温柔;我想学习。例如,请随意将变量名称更改为更传统的名称或其他名称。