什么是足够大的样本量?

数据挖掘 统计数据
2022-03-12 12:51:42

我每周有 600 名客户。我需要调查多少才能获得一个好的样本?

我对统计很陌生。

1个回答

这在很大程度上取决于,如果要对总人口进行推断,则需要确定可以允许的误差范围和置信水平。然后,这些将帮助您确定所需的样本量。

如果我们想估计总体平均值之间的最大差异由下式给出:μx¯μ

ϵ=zα2σn

其中是样本大小,是总体标准差,通常称为临界值,它源自标准正态分布。这些值可以在表格中或使用 r 或 python 找到,例如 1.96 对应于 95% 的置信水平。nσzα2

知道(您通常不知道)将允许您确定所需的样本量,置信水平为您可以尝试使用这通常就足够了。也存在确定的方法。无论如何,您可以将上述关系重新排列如下:σμ±ϵ1ασ=12σ

n=(zα2σϵ)2

事实上,这个问题很难回答。有许多因素决定了您的研究所需的样本量。你绝对应该从 很棒的概率论开始阅读一些关于基本统计的材料,然后继续研究推论统计。

值得花一些时间来了解您的案例中的总人口数量,以及关于推理问题,样本是否包含足够的相关观察结果?我认为您的问题中没有提供足够的信息来提供一个好的答案。

您可以查看进行的类似调查并查看他们使用的样本量。

当您对人口了解不多时,另一种常见的方法是使用斯洛文公式

n=N(1+Nϵ2)

其中是总人口。举个例子,给定 98% 的置信度 ,总人口为 600。我们会得到 Nϵ=0.02

n=6001+600×0.022=484.

请注意,斯洛文的公式 很容易被误用,但可以为您提供一个很好的起点。

如果您打算继续使用 DS,我强烈建议您学习统计学。

希望这至少提供了一些帮助。