我们如何确定小样本何时具有统计显着性?

机器算法验证 统计学意义 人口
2022-02-03 07:07:52

抱歉,如果标题不清楚,我不是统计学家,也不知道如何表达。

在 worldometers 上查看全球冠状病毒统计数据,并按每百万人口的病例数对表格进行排序,以了解不同国家的情况。

注意我在下面使用梵蒂冈城纯粹是因为那是我在列表中看到的第一个小国。正如@smci 指出的那样,梵蒂冈城有一些问题可能使其与其他问题有所不同。因此,请在阅读时牢记“小国”,因为我的问题适用于任何小国。

该表显示梵蒂冈城是第 7 大最糟糕的国家,每百万人中有 33,666 例病例。现在鉴于梵蒂冈城的总人口只有802人,我不知道我们能从这个数字中得到多少。当该国人口较少时,即使病例数的微小波动也会对每百万病例数产生重大影响。作为一个人为的例子,考虑一个只有 1 个居民的虚构国家。如果那个人感染了病毒,那么每百万的病例数将是 1,000,000,这远高于该表中的任何内容。

显然梵蒂冈城是一个极端的例子,但还有其他一些人口较少的国家在名单上排名很高,我想同样的问题也适用于他们。

那么有没有一种方法可以决定什么是“太小”而不重要的人口?

如果这个问题不够清楚,请解释原因而不是投反对票,因为我想理解它,如果我解释得不够好,我很乐意澄清。

4个回答

我将描述统计学家如何解释计数数据。通过一点点练习,你也可以做到。

基本分析

当案例随机且独立地出现时,它们发生的时间可以用泊松过程合理准确地建模。 这意味着出现在任何预定区间内的病例数具有泊松分布。我们唯一需要记住的是它的方差等于它的期望。用不太专业的术语来说,这意味着该值可能与平均值不同的量(其标准误差)与平均值的平方根成正比 (有关计数数据的平方根和一些相关转换的解释和讨论,请参阅为什么建议对计数数据进行平方根转换。)

在实践中,我们通过使用观察值来估计平均值。因此,

具有相等预期发生率的独立事件计数的标准误差是计数的平方根。

(对于非常小的计数,尤其是零计数,存在对该规则的各种修改,但这在本申请中不应该成为问题。)

就梵蒂冈城而言,每百万人中有 33,666 起案件的比率相当于

33666106×802=27

案例。的平方根275(我们通常不需要担心这种分析的额外有效数字,这通常是在精神上和近似地完成的)。

等效地,这个标准误差是27案件出802人,相当于6500每百万。因此,我们有理由说明

梵蒂冈城的病例率为33666±6500每百万。

这表明引用五个有效数字的利率是多么愚蠢。最好通过限制 sig figs 来确认较大的标准误差,如

观察到的梵蒂冈城病例率为34000±6500每百万。

(不要犯只取比率平方根的错误! 在这个例子中,33,666 的平方根只有 183,这太小了。对于估计标准误差,平方根适用于计数,而不是比率。

一个好的经验法则是在报告标准错误时使用一个额外的有效数字,就像我在这里所做的那样(病例率四舍五入到最接近的千位,其 SE 被四舍五入到最接近的 100)。

稍微细致一点的分析

病例不是独立的:人们从其他人那里捕捉到它们,并且由于人类不会像一瓶热气体中的原子一样在世界各地飞来飞去,因此病例会成群结队地发生。这违反了独立性假设。那么,真正发生的是,有效计数应该介于病例数和不同聚类数之间。我们无法知道后者:但它肯定小于(也许远小于)病例数。因此,

当事件(正)相关时,平方根规则给出了标准误差的下限。

您有时可以估计如何调整标准误差。例如,如果您猜测案例以十个左右的集群发生,那么您应该将标准误乘以十的平方根。一般来说,

正相关事件计数的标准误差非常粗略地是计数的平方根乘以典型集群大小的平方根。

这种近似是通过假设一个集群中的所有案例完全相关而产生的,否则任何两个不同集群中的案例都是独立的。

如果我们怀疑梵蒂冈城的病例是聚集的,那么在最极端的情况下它是一个单一的聚集:计数是1,它的平方根是1,因此,标准误差是一个完整的集群:即,大约27人们。如果您想谨慎地不要夸大数字的可靠性,那么您可能会认为梵蒂冈城的比率介于略高于零和可能低于每百万 70,000 之间(1±1集群的27的人口802)。

引用维基百科

在统计假设检验中,当假设原假设不太可能发生时,结果具有统计显着性。

统计测试的结果可能很重要,也可能不重要。样本大小不是测试。在什么意义上有意义?COVID-19 的流行是特定国家的一个特征,在特定时间点,一个国家的流行率比其他国家小(或大)这一事实并不会使其“显着”更多或更少。就像你说的高人比矮人更重要,这种说法没有意义。

您是正确的,较小的样本可以比较大的样本变化更大,但是您需要考虑相对于总体规模的这一点。802 个案例的样本不足以说明中国的人口,但如果是梵蒂冈城,这将是整个人口,因此没有不确定性。

最后,如果您的意思是梵蒂冈城的流行率并不“显着”,因为它没有将许多病例加到全球 COVID-19 的总流行率中,那么您是正确的。但是,如果这是您感兴趣的内容,而不是查看相对流行率(每 10 万居民),您应该查看原始计数,对于较大的国家,这显然会更大。

@Avroham。我认为“重要”这个词是如此模棱两可,你不应该在你的问题中使用它。它在统计学中具有非常明确的技术含义,但更普遍地具有许多其他含义。我认为“统计上令人信服”这个词会更好。它在某种意义上更加模棱两可,但它没有可以与日常含义混淆的技术含义。@whuber 的出色回复仍然与此改写完全相关。

我认为您要问的是是否需要采取一些预定的最小样本量才能具有统计意义。在以案件/百万人来看世界与梵蒂冈的情况下,其明显的比率为 78 亿与 807 使得任何比较都微不足道。即,两者都不能预测对方。您想知道最小样本量是显着的。是780吗?7,800?78,000?78万?780万?78M?780 米?我认为你可以在对选民进行投票时做小样本并获得显着的结果,但对于像 covid19 这样的事情,它确实归结为诸如地点、人口密度、技术进步、他们是否拥有现代医疗系统等因素。自己,梵蒂冈的样本可能会与纽约市的 5 个街区区域进行很好的比较,就“