随机抽样

数据挖掘 统计数据
2022-02-14 09:26:36

如果我有一个装满编号球的袋子。数字是从 1 到 10。但是球的数量遵循泊松分布,lambda=1。

只是如下图 在此处输入图像描述

现在我想使用随机抽样制作 30 个样本。如果我在没有放回的情况下抽取 30 个球的样本,是否应该称为随机抽样?

因为据我所知,随机抽样是一个选择观察的过程,在这个过程中,来自总体的每个观察都有相同的概率被选为样本。

但是,如果我在上面的示例中从袋子中选择任何球,那么编号为 0 和 1 的球被选中的概率将高于编号为 7 和 8 的球的概率。

1个回答

如果你抽取一个同样有利于袋子里每个球的样本——不管球上的数字——这将是一个随机样本。

如果期望随机样本与袋子中的球具有相似的分布,那么带放回抽样会更好。

但是,如果抽奖次数很少(而且袋子很大),那么更换它们与否的天气应该无关紧要。

请参阅此处此处了解不更换采样时的修正。