“本质上,所有模型都是错误的,但有些模型是有用的。”
--- 盒子,乔治 EP;诺曼·R·德雷珀 (1987)。经验模型构建和响应曲面,p。424,威利。国际标准书号 0471810339。
上面这句话的具体含义是什么?
“本质上,所有模型都是错误的,但有些模型是有用的。”
--- 盒子,乔治 EP;诺曼·R·德雷珀 (1987)。经验模型构建和响应曲面,p。424,威利。国际标准书号 0471810339。
上面这句话的具体含义是什么?
我认为最好通过两部分来分析它的含义:
“所有模型都是错误的”,即每个模型都是错误的,因为它是对现实的简化。一些模型,尤其是在“硬”科学中的模型,只有一点点错误。他们忽略了诸如摩擦或微小物体的引力效应之类的东西。其他模型有很多错误——他们忽略了更大的事情。在社会科学中,我们忽略了很多。
“但有些是有用的”——对现实的简化可能非常有用。它们可以帮助我们解释、预测和理解宇宙及其所有组成部分。
这不仅在统计中是正确的!地图是一种模型;他们错了。但是好的地图非常有用。其他有用但错误的模型的例子比比皆是。
这意味着可以从模型中提供有用的见解,这些模型不能完美地代表它们所建模的现象。
统计模型是使用数学概念对系统的描述。因此,在许多情况下,您会添加一定的抽象层来促进您的推理过程(例如,测量误差的正态性、相关结构中的复合对称性等)。考虑到我们对世界的主观看法,单个模型几乎不可能完美地描述现实世界的现象(我们的感觉系统并不完美);然而,成功的统计推断确实会发生,因为我们的世界确实具有我们利用的某种程度的一致性。所以我们几乎总是错误的模型证明是有用的。
(我相信你很快就会得到一个大胆的答案,但我试图在这个问题上简洁!)
我找到了 Thad Tarpey 在2009 年的 JSA 演讲,为 Box 段落提供了有用的解释和评论。他认为,如果我们将模型视为对事实的近似,我们可以很容易地称所有模型都是正确的。
这是摘要:
统计学的学生经常被介绍给 George Box 的名言:“所有模型都是错误的,有些是有用的。” 在这次演讲中,我认为这句话虽然有用,但却是错误的。一个不同的、更积极的观点是承认模型只是从数据中提取感兴趣信息的一种手段。事实是无限复杂的,模型只是对事实的近似。如果近似值很差或具有误导性,则该模型是无用的。在这次演讲中,我给出了一些不是真实模型的正确模型的例子。我说明了“错误”模型的概念如何导致错误的结论。
对我来说,真正的洞察力在于以下方面:
模型不一定要正确才能有用。
不幸的是,在许多科学中,经常忘记模型不一定需要是现实的精确表示来允许新的发现和预测!
因此,不要浪费您的时间来构建需要准确测量无数变量的复杂模型。真正的天才发明了一个简单的模型来完成这项工作。