“统计证明”的概念

机器算法验证 推理 证明
2022-03-04 15:36:11

当新闻谈论事物被“统计证明”时,他们是正确地使用了定义明确的统计概念,还是错误地使用了它,或者只是使用了矛盾的说法?

我认为“统计证明”实际上不是为了证明假设而执行的操作,也不是数学证明,而是更多的“统计检验”。

3个回答

人们谈论的新闻是任何人的猜测,并因新闻广播而异。也许最常见的是他们给出了一个需要几页的研究总结。

但是,您的最后一段是错误的。据统计,每个家庭没有 2.4 个孩子。平均值是 2.4 个孩子这是完全可能的。如果您对美国家庭进行随机抽样(这很棘手,但可能),那么您将得到平均值的估计值。但是,如果你对家庭进行人口普查,那么,如果人口普查真的得到了每个家庭(它没有),或者,如果它得到的人代表了它没有得到的人,关于孩子的数量,那么你就会证明这个事实。

然而,人口普查不仅错过了人,它错过的人在很多方面都与它得到的人不同。因此,人口普查局试图弄清楚它们有何不同;因此,再次估计每个家庭的孩子数量。

但是有些事情你可以证明;如果你想知道,比如说,你所在系的每个教授教书的平均年数,你可以得到准确的数据并得出一个准确的平均值。

您的倒数第二段也有问题,因为精确地进行了统计测试以证明假设;更准确地说,它们(无论如何在频率论框架中)是为了在给定的显着性水平上拒绝零假设。

我认为 - 就像很多事情一样 - 这是广泛的文化误解和新闻业对有力速记的尝试的结合,结果有时会产生误导。

手机致癌! ”广告比一些关于调查可能的链接的解释卖得更多。

当然,基于统计推断的结论在任何硬意义上都不能证明。它依赖于假设,即使这样,结论(充其量)也是概率性的(正如我们所得到的,比如贝叶斯推理),然后使用频率论推理,您必须添加对 p 值的误解的常见错误作为概率空为真。这甚至没有考虑出版或报告偏见等问题

在更普遍的科学报道中,您会看到类似的错误,这同样令人沮丧

我自己不喜欢“统计证明”这个词,因为我认为它给人的印象是错误的。虽然统计数据做得好是一种强大的工具,但统计数据实际上告诉我们的事情可能非常微妙,对所学知识的意义的适当讨论以及对结论的附带资格通常不适合标题或标题的炒作和有力。在通常的名人八卦之间挤进了匆忙的几段。

事实上,即使在那些似乎必不可少的学术期刊中,它们也经常被搁置一旁,取而代之的是出现一些公式化的声明(从研究领域到研究领域不同),被认为是对结果的“涂抹”。

我认为有空间仔细解释从推理结果(无论是点和区间估计、假设检验、决策理论计算还是一些视觉比较的探索性构建)到它们得出的结论的推理。这种推理是问题的真正核心所在(包括推理中的空白将暴露在哪里,如果它们是明确的),我们很少看到它被阐明。

除此之外,我们可以继续发出警告

经验知识总是概率性的——从来没有明确的真假,但总是介于两者之间。统计“证明”是收集足够数据以将假设错误的概率降低到低于某个公认阈值的问题。“真理”或“正确性”的门槛因一门学科而异。社会学家对 95% 的正确概率感到满意,有时会接受更少;量子物理学家要求 99.99999% 或更高。