我有一个混合均匀的大桶,里面装着无数的弹珠。大桶里有无限数量的弹珠,但它们只有一些未知但数量有限的品种:
是未知的,并且对于,画一个-type marble 可能比绘制 a型大理石。
在一个实验中,一台机器使用一些未知的程序对大桶进行采样。机器报一套描述样品中的各种大理石:
重复该实验的试验(在试验中是固定的),我们得到一个子集的序列,.
我们唯一知道的其他事情是:
- 试验是独立且相同的
- 机器报顶样本中出现频率最高的品种
我们不知道这台机器是如何对弹珠进行采样的。它可以选择大量弹珠,然后报告最频繁。或者,它可以继续捡起弹珠,直到有品种。它还可以做其他事情。
请问我们的试验分布受机器取样程序的影响?