我应该多认真地思考不同的统计学哲学?

机器算法验证 贝叶斯 常客 哲学的
2022-01-28 11:51:58

我刚刚完成了一个模块,其中我们介绍了统计问题的不同方法——主要是贝叶斯与频率论。讲师还宣布她是常客。我们讨论了一些悖论,以及每种方法的怪癖(长期频率、先前的规范等)。这让我开始思考——我需要多认真地考虑这一点?如果我想成为一名统计学家,我是否需要让自己与一种哲学保持一致?在我解决问题之前,我是否需要特别提及我将应用哪种思想流派?至关重要的是,我是否需要小心不要将常客和贝叶斯方法混合在一起并引起矛盾/悖论?

4个回答

我认为这里的主要内容是:存在这些不同的统计哲学和对它们的分歧这一事实意味着,将一个人从应用统计公式中获得的“硬数字”转化为“现实世界”的决策是一种非微不足道的问题,并且充满了解释性的危险。

人们经常使用统计数据来影响他们在现实世界中的决策。例如,科学家们现在并没有为了搞笑而对 COVID 疫苗进行随机试验:这是因为他们想要做出现实世界的决定,决定是否向民众施用特定的候选疫苗。尽管收集 1000 名测试对象并在疫苗接种过程中观察他们可能是一项后勤挑战,但无论你是频率论者还是贝叶斯论者,所有这一切背后的数学都是明确定义的:你把收集到的数据,补习班它通过公式和数字弹出另一端。

然而,这些数字有时很难解释:它们与现实世界的关系取决于许多非数学的东西——这就是哲学的用武之地。现实世界的解释取决于我们如何收集这些测试对象。这取决于我们先验地预期这种疫苗有效的可能性有多大(我们是从帽子里拿出一个分子,还是从一种已知有效的疫苗生产方法开始?)。这取决于(也许是不直观的)我们碰巧测试了多少其他候选疫苗。这取决于等等等等等等。

贝叶斯主义者试图引入额外的数学框架来帮助缓解其中一些解释问题。我认为频率论方法继续激增的事实表明,这些额外的框架在帮助人们将他们的统计计算转化为现实世界的行动方面并不是非常成功(尽管可以肯定的是,贝叶斯技术已经在该领域带来了许多其他进步,与此特定问题没有直接关系)。

要回答您的具体问题:您无需将自己与一种哲学保持一致。具体说明您的方法可能会有所帮助,但通常很明显,当您开始谈论先验时,您正在进行贝叶斯分析。最后,尽管如此,你应该非常认真地考虑所有这些,因为作为一名统计学家,确保你提供给人们的数字被负责任地使用是你的道德责任——因为正确解释这些数字是一个难题。无论您是通过频率论还是贝叶斯哲学来解释您的数字都不是什么大问题,但是对您的数字的解释需要熟悉相关的哲学。

关于我的命名法的初步说明:作为一个初步的问题,我注意到我从来不喜欢用“频率学派”来形容它所指的哲学和一套方法,所以我把这个学派称为“经典”。贝叶斯主义者和古典统计学家都完全同意与大数定律有关的相关定理,因此两组都同意概率的“频率论”解释在有效假设下成立(即,表示实验“重复”的可交换值序列)。所有贝叶斯主义者也是“频率论者”,因为我们接受大数定律并同意概率对应于适当情况下的极限频率。由于对大数的基本定律没有真正的分歧,


这让我开始思考——我需要多认真地考虑这一点?

其他人可能不同意这里,但我的观点是,如果你想成为一名优秀的统计学家,重要的是要认真对待该领域的基础问题,并在培训期间认真思考这些问题。哲学和方法论问题似乎与数据分析相去甚远,但它们是指导您选择建模方法以及结果的解释和交流的基础问题。

学习某些东西总是需要权衡取舍(尽管并不总是与其他学习相对!),因此您需要在学习统计学中的哲学和基础问题与将时间用于其他事情之间做出适当的权衡。这种权衡将取决于您的具体愿望,即您希望对该主题的了解有多详细。在培训成为该领域的学者时(即,在攻读博士学位时),我花了很多时间阅读关于这个主题的哲学论文,思考它们的含义,并在深夜醉酒后与不情愿的年轻女士们谈论这个话题在大学聚会上。我现在——作为一名实践学者——的观点是,这段时间是值得的。

如果我想成为一名统计学家,我是否需要让自己与一种哲学保持一致?

如果您发现一种哲学/方法完全正确,那么您应该完全与那一种哲学/方法保持一致。然而,有许多统计学家在不同情况下发现每种方法都有一些优点,或者认为一种范式在哲学上是正确的,但在某些情况下难以应用。在任何情况下,都没有必要只让自己与一种方法保持一致。

要成为一名优秀的统计学家,您当然应该了解两种范式之间的区别,并能够在任何一种范式中应用模型。您还应该对何时使用特定方法更容易解决特定问题有所了解。(例如,一些“悖论”出现在经典方法下,在贝叶斯分析中很容易解决。相反,一些建模情况在贝叶斯分析中很难处理,例如当我们想要针对一个广泛但模糊的特定零假设检验时备择假设。)一般来说,如果你可以扩大你的“工具包”以熟悉更多的方法和模型,你将有更大的能力在统计问题中部署有效的方法。

在我解决问题之前,我是否需要特别提及我将应用哪种思想流派?

这取决于上下文,但出于一般建模目的,不——这从您应用的模型类型和分析中显而易见。如果您将先验分布应用于未知参数并得出后验分布,我们将知道您正在进行贝叶斯分析。如果您将未知参数视为“未知常数”并使用经典方法,我们就会知道您正在使用经典分析。在良好的统计写作中,您应该明确说明您正在使用的模型(如果您正在撰写学术论文,可能会提供参考),并且您可能会借此机会明确指出您是否正在进行贝叶斯分析,但即使您不这样做' t,这将是显而易见的。

当然,如果您要解决的问题是理论或哲学问题(与数据分析问题相反),那么它可能取决于对概率的相关解释以及随之而来的方法论范式。在这种情况下,您应该明确说明您的哲学/方法论方法。

至关重要的是,我是否需要小心不要将常客和贝叶斯方法混合在一起并引起矛盾/悖论?

除非您认为其中一种方法完全无效,以至于永远不应该使用它,否则可以合理地在适当的情况下混合使用方法。同样,了解每种范式的长处和弱点将有助于您了解何时更容易应用一种范式。

在实际的统计工作中,很常见的是贝叶斯分析将一些经典方法应用于诊断目的,以测试基本假设。这通常发生在我们想要针对一个广泛而模糊的备选方案(即备选方案未指定为本身适合贝叶斯分析的参数模型)测试贝叶斯模型的某些假设时。例如,我们可能使用线性回归模型进行贝叶斯分析,然后应用 Grubb 检验(经典假设检验)来检验正态分布误差项的假设是否合理。或者,我们可以使用一组不同的模型进行替代贝叶斯分析,然后使用经典方法进行交叉验证。也许有一些贝叶斯“纯粹主义者”

如果你混合这两种方法,那么你当然需要注意在你的分析中产生矛盾或“悖论”,但显然这需要你对这两种范式有一个很好的理解,这进一步需要你花时间去研究学习他们。

我尝试在已经存在的值得阅读的答案中添加一些内容。

  1. 我确实认为基础讨论涉及作为统计学家重要的基本问题,特别是“我们所说的概率是什么意思?” 在运行测试、置信区间或计算后验时理解“推理逻辑”也至关重要。

  2. 我还认为重要的是要知道问题超出了贝叶斯/频率论的区别。尤其是贝叶斯的变种,对概率的理解至少在一定程度上有所不同,主要是激进的主观主义者,即所谓的客观贝叶斯,以及偏爱贝叶斯推理模型和参数但给出模型和参数的人一个常客的意思,在 Sec 中称为“证伪主义贝叶斯”。Gelman 和 Hennig (2017)的第 5 条,他们给出了合理的“中性”概述。此外,存在与长期频率(通常称为“倾向”)没有直接关系的“偶然概率”(与认知相反,即形式化主观不确定性)的概念。

  3. 在我看来,理解统计学和概率基础中的概念的关键是,我们通常在处理数学模型,而现实是不同的,即没有“真正的”频率概率可以找到,也没有有任何与它的贝叶斯模型相同的“真正理性和正确的推理”。无论我们是以贝叶斯方式还是频率论方式工作(以及这些方式中的哪一种),我们都使用模型来使数学推理可用于理解现实中的现象,这涉及抽象、简化以及以一种或另一种方式,操纵。我们将它们用作思考的工具;它们适应我们的思想,而不是首先适应我们思想之外的任何现实。为此原因,

  4. 这意味着我个人认为不同的基础方法不应被视为一种“正确”或“错误”的统计哲学,这也意味着没有人需要只致力于其中一种。特别是,“认知”概率(经常但不总是用于主观主义/“客观”贝叶斯推理)模拟个人或科学/人类整体的不确定性,而“随机”概率(通常用于频率论推理) 对世界上数据生成过程的行为进行建模。这些是不同的,人们很可能对一个研究问题的一件事和另一件事感兴趣。

  5. 我确实认为,尽管在同一项研究中“将它们混合在一起”是有问题的。在进行概率建模时,结果以概率的形式出现(无论是 p 值、置信水平还是后验概率),因此应该对同一模型中出现的所有概率使用一致的含义。我认为统计学家在给定情况下使用概率时应该清楚他们的意思,并且混合通常以一种不清楚的方式进行(特别是我看到很多贝叶斯工作,其中可能性显然被解释为频率主义的方式,指的是真正存在的数据生成过程,其中没有解释先验概率的含义,即使有时以非常粗略的方式与某些可用知识相关)。

  6. 但是,我也认为可能存在“合法混合”,例如在先验分布可以被解释为本身是从“真实过程”(例如,类似的研究/问题)产生的情况下,或当贝叶斯主义者在应用一致的认知概率时,仍然对他们正在做的事情的常客属性感兴趣时,因为他们可能会发现常客建模的逻辑(“如果现实按照常客模型 X 表现会发生什么”)有助于了解贝叶斯方法的含义。有时可以引入先验,认为它们的引入改进了一种方法的频率特征,而不是认为它们适当地表达了主观或客观的认知概率。所以我认为“混合”

你不应该做的是让自己与一个人保持一致,即宣布其中一个“正确”而另一个“错误”。它们只是对同一事物的两种不同观点,为您提供了另一种“交易工具”。作为专家,您应该精通两者。出于实际原因,您可以选择专注于其中一项而不是另一项。打个比方,想想一个擅长法国菜的厨师,但在需要的时候仍然可以做出美味的泰式咖喱。

你的问题听起来你可能害怕统计中存在教条之战。这些教条之战不时发生在科学中,但我认为它们更像是人类从事科学工作的一种人工制品,而不是基于现实世界的事实。教条战争的通常进展是:首先有两个关于“热点”未解决问题的理论,然后是一场几十年后失败的人气竞赛,然后下一代科学家发现这两个理论都有优点和并不像在辩论高峰时提出的那样相互排斥。你可以找到许多很好的历史例子,例如 20 世纪初的凯恩斯主义经济学家与新古典主义经济学家,或者环境影响是否可遗传的问题(通常仍被过度简化为达尔文主义与现代主义)。

幸运的是,目前统计界没有这样的教条之战(甚至在贝叶斯还活着的时候也没有),所以你不必选择一个阵营并试图带领它走向胜利或战斗。一个宣称自己是常客的统计学家,充其量是在试图说“我更喜欢使用常客工具”,而在最坏的情况下,一个认为所有其他哲学“不合适”的势利小人,在这里再想象一下法国厨师,也许是一个预先全球化一,他认为泰国食物是“不可食用的”。

您应该将“常客”(或“贝叶斯”)声明理解为您将从课程或与该人的讨论中获得的信息风格的重要信号,仅此而已。