可以强制样本中的随机性吗?

机器算法验证 采样 民意调查 随机性
2022-04-17 12:46:13

我最近与一家大型定性分析公司进行了交谈,该公司正在对火车公司的潜在客户进行深入分析。我问他们如何选择要包括在样本中的人,他们说,他们是从该地区的人员名单中随机挑选的,但他们也说有预定义的标准,需要的样本男女分布均等与该地区一样,在种族、收入、教育等方面也是如此。我问他们是否认为他们选择的列表有偏见,但这不是原因,而是让样本更加随机。这是否有意义,或者它们是否冒着干扰随机性的风险,从而降低随机性?他们的样本大约有 100 人,但我也对极少数人的答案感兴趣。

2个回答

您在此处描述的过程称为配额抽样这是一种非随机抽样方法。该程序经常用于没有可用抽样框的情况。在这种情况下,它提供了一种方便且廉价的取样方式。

分层抽样是不同的。在分层抽样中,人口被分成一定数量的不重叠的子人口,每个人口都是独立抽样的。或者换一种说法,采样率在子群体之间有所不同。

示例:要从一个组中抽取一个简单的随机样本,您可以对总体应用统一的抽样率,例如 10%。在分层抽样中,您将人口分成两组,例如农村和城市。对于每个组,您应用不同的抽样率,例如,城市人口为 5%,农村人口为 20%。

可能很容易犯错误(如果您粗心的话)并将其解释为分层抽样而不是配额抽样。正如 whuber 在下面的评论中指出的那样,分层抽样需要在抽样之前将人口分成几组。

“这被称为分层抽样。它不会使它比简单随机抽样“更随机”。

对于较小的样本,它实际上更合适。通过简单的随机抽样,您的样本更有可能过度代表人口的一个类别。”