我多次阅读/听说至少 30 个单位的样本量被视为“大样本”(由于 CLT,平均值的正态性假设通常近似成立,...)。因此,在我的实验中,我通常会生成 30 个单位的样本。您能否给我一些在使用样本量 30 时应该引用的参考资料?
应该引用哪些参考资料来支持使用 30 作为足够大的样本量?
实际上,“幻数”30是一个谬误。请参阅 Jacob 的 Cohen 令人愉快的论文,我学到的东西(到目前为止)(Am. Psych. December 1990 45 #12, pp 1304-1312)。这个神话是他第一个例子,说明“你学到的一些东西不是这样”。
[O] 我的一位博士生同事进行了一篇论文 [with] 每组只有 20 个案例的样本。... [L]ater 我发现...对于在神圣的双尾的两个独立组平均比较,中等效应被标记的概率与...一样显着,t检验仅为。因此,一个人是否会获得显着的结果大约是抛硬币,尽管实际上效果大小是有意义的。... [我的朋友] 最终得到了无关紧要的结果——他以此开始摧毁精神分析理论的一个重要分支。
选择n = 30 作为小样本和大样本之间的边界只是一个经验法则。有大量书籍引用(围绕)这个值,例如,Hogg 和 Tanis 的概率和统计推断(7e) 说“大于 25 或 30”。
也就是说,告诉我的故事是,30 被认为是一个好的边界的唯一原因是因为它使教科书背面的漂亮学生t表可以很好地放在一页上。无论如何,从 df = 30 到 df = 无穷大,临界值(Student's t和 Normal 之间)仅相差大约 0.25。对于手工计算,差异并不重要。
如今,很容易将各种事物的临界值计算到小数点后 15 位。最重要的是,我们有重采样和排列方法,我们甚至不限于参数人口分布。
在实践中,我从不依赖n = 30。绘制数据。如果您愿意,可以叠加正态分布。直观地评估正态近似值是否合适(并询问是否真的需要近似值)。如果生成用于研究的样本和近似值是强制性的,则生成足够的样本量以使近似值尽可能接近(或尽可能接近计算上可行)。
IMO,这完全取决于您想将样品用于什么用途。两个“愚蠢”的例子来说明我的意思:如果你需要估计一个平均值,30 次观察就绰绰有余了。如果您需要用 100 个预测变量估计线性回归,则 30 个观察值将不够接近。
大多是任意的经验法则。这种说法的真实性取决于许多因素。例如关于数据的分布。例如,如果数据来自 Cauchy,即使 30^30 个观测值也不足以估计平均值(在这种情况下,即使是无限数量的观测值也不足以导致收敛)。如果您绘制的值不是彼此独立的,则此数字 (30) 也是错误的(同样,无论样本大小如何,您都可能认为根本没有收敛)。
更一般地说,CLT 基本上需要两个支柱来支撑:
- 随机变量是独立的:您可以重新排列观察结果而不会丢失任何信息*。
- rv 来自具有有限二阶矩的分布:这意味着均值和 sd 的经典估计量随着样本量的增加而趋于收敛。
(这两种情况都可以有所减弱,但差异主要是理论上的)