你能说统计和概率就像归纳和演绎吗?

机器算法验证 可能性 数理统计
2022-02-04 06:19:59

我已经通读了这个线程,在我看来可以这样说:

  • 统计=归纳?
  • 概率=扣除?

但我想知道是否有更多关于我缺少的比较的细节。例如,统计是否等于归纳,或者只是它的一个特例?似乎概率是演绎的一个子案例(因为它是数学思维的一个子案例)。

我知道这是一个挑剔的问题,但从某种意义上说,这就是我问这个问题的原因——因为我想确定如何准确地比较这些术语。

4个回答

我认为最好在回答您的问题之前快速回顾一下归纳推理和演绎推理的含义。

  • 演绎推理:“演绎论证是试图表明结论必然来自一组前提。如果结论确实必然来自前提,即如果结论必须为真,前提是前提为真,则演绎论证是有效的. 一个演绎论证是正确的,如果它是有效的并且它的前提是真实的。演绎论证是有效的或无效的,健全的或不健全的,但绝不是错误的或真实的。引自维基百科,强调添加)。

  • “归纳推理,也称为归纳或归纳逻辑,或口语英语中的有根据的猜测,是一种推理,即使在所有前提都为真的情况下,也允许结论为假的可能性。归纳逻辑论证的前提表明对结论的某种程度的支持(归纳概率),但不包含它;也就是说,他们不确保其真实性。 ”(来自维基百科,强调添加)

强调主要区别:演绎推理将真理从前提转移到结论,而归纳推理则不然。也就是说,对于演绎推理,你永远不会扩展你的知识(即,一切都在前提中,但有时是隐藏的,需要通过证明来证明),而归纳推理允许你扩展你的知识(即,你可能会获得新的见解,但是,它们还没有包含在前提中,因为不知道它们的真实性)。

这与概率和统计有什么关系?

在我看来,概率必然是演绎的。它是数学的一个分支。因此,它基于一些公理或想法(假设是真实的)推导出理论。

然而,统计数据不一定是归纳性的。仅当您尝试使用它来生成有关未观察到的实体的知识时(即,追求推理统计,另请参见 onestop 的答案)。但是,如果您使用统计数据来描述样本(即描述性统计数据),或者如果您对整个人口进行抽样,它仍然是演绎性的,因为您无法获得样本中已经存在的更多知识或信息。

所以,如果你把统计看作是科学家的英勇努力,他们试图使用数学方法来寻找支配世界上经验实体相互作用的规律,这实际上永远不会成功(即,我们永远不会真正知道是否有我们的理论是正确的),那么,是的,这就是归纳。这也是弗朗西斯·培根所阐述的科学方法,现代经验科学就是在此基础上建立起来的。该方法得出的归纳结论充其量是高度可能的,尽管不是确定的。这反过来又导致非科学家对科学理论和科学证明的含义产生误解。


更新:在阅读了 Conjugate Prior 的回答之后(经过一夜的思考),我想补充一些东西。我认为(推论)统计推理是演绎还是归纳的问题取决于您到底感兴趣的是什么,即您正在争取什么样的结论。

如果您对概率结论感兴趣,那么统计推理就是演绎。这意味着,如果您想知道例如,在 100 个案例中的 95 个中,总体值是否在某个区间(即置信区间)内,那么您可以获得该陈述的真值(真或假)。您可以说(如果假设正确),100 个案例中有 95 个案例的总体值在区间内。但是,在任何经验案例中,您都不会知道总体值是否在您获得的 CI 中。不管是不是,但没有办法确定。相同的推理适用于经典 p 值和贝叶斯统计中的概率。你可以确定概率。

但是,如果您对有关经验实体的结论感兴趣(例如,人口值在哪里),您只能争论归纳。您可以使用所有可用的统计方法来积累支持有关经验实体或与它们相互作用的因果机制的某些命题的证据。但是你永远无法确定这些命题中的任何一个。

回顾一下:我想说的是,你在看什么很重要。你可以推断出概率,但对于每一个关于事物的明确命题,你只能找到支持的证据。不多。另请参阅 onestop 到归纳问题的链接。

统计是归纳的演绎方法。考虑统计推断的两种主要方法:频率论和贝叶斯。

假设您是一名常客(为了方便,采用 Fisher 的风格,而不是 Neyman)。您想知道一个重要的参数是否具有特定值,因此您构建了一个模型,选择与该参数相关的统计量,并执行测试。假设您的模型是正确的,您的测试生成的 p 值表示看到统计量比从您拥有的样本计算的统计量更极端的概率。您得到一个足够小的 p 值,因此您拒绝参数确实采用该值的假设。你的推理是演绎的:假设模型是正确的,要么参数确实具有实质性利益的价值,但你的样本不太可能看到,或者实际上并没有采用该值。

从假设检验转向置信区间:您的参数有 95% 的置信区间,其中不包含实质性利益值。您的推理再次是演绎的:假设模型是正确的,或者这是当参数确实具有实质性兴趣值时将出现 20 次中 1 次的罕见区间之一(因为您的样本不太可能),或者参数实际上没有那个值。

现在假设您是贝叶斯主义者(采用拉普拉斯而不是格尔曼的风格)。您的模型假设和计算为您提供了参数值的(后验)概率分布。此分布的大部分质量与实际感兴趣的值相去甚远,因此您得出结论,该参数可能不具有此值。您的推理再次是演绎的:假设您的模型是正确的,并且如果先验分布代表您对参数的信念,那么您根据数据对它的信念由您的后验分布描述,该分布对该值的概率很小。由于这种分布对实质性利益的价值提供的支持很少,您可能会得出结论,该参数实际上没有价值。(或者您可能满足于说明它的概率)。

在所有这三种情况下,您都会得到一个逻辑析取来作为您的行动的基础,该析取是从假设中演绎/数学推导出来的。这些假设通常是关于如何生成数据的模型,但也可能是关于其他数量的先验信念。

是的!也许统计并不严格等于归纳,但在我看来,统计是归纳问题的解决方案。

归纳:对于统计问题,样本和推论统计使我们能够得出关于总体的结论,而推论统计清楚地利用了概率元素。

推论:概率元素使我们能够根据人口的已知特征得出关于从人口中提取的假设数据的特征的结论。

参考:Walpole RE、Myers RH、Myers SL、Ye K。工程师和科学家的概率和统计。皮尔逊普伦蒂斯大厅;2011 年。