机器算法验证 - “所有模型都是错误的，但有些是有用的”是什么意思 - 吾爱随笔录

“所有模型都是错误的，但有些是有用的”是什么意思

机器算法验证造型

2022-02-04 23:16:58

“本质上，所有模型都是错误的，但有些模型是有用的。”

--- 盒子，乔治 EP；诺曼·R·德雷珀 (1987)。经验模型构建和响应曲面，p。424，威利。国际标准书号 0471810339。

上面这句话的具体含义是什么？

4个回答

我认为最好通过两部分来分析它的含义：

“所有模型都是错误的”，即每个模型都是错误的，因为它是对现实的简化。一些模型，尤其是在“硬”科学中的模型，只有一点点错误。他们忽略了诸如摩擦或微小物体的引力效应之类的东西。其他模型有很多错误——他们忽略了更大的事情。在社会科学中，我们忽略了很多。

“但有些是有用的”——对现实的简化可能非常有用。它们可以帮助我们解释、预测和理解宇宙及其所有组成部分。

这不仅在统计中是正确的！地图是一种模型；他们错了。但是好的地图非常有用。其他有用但错误的模型的例子比比皆是。

这意味着可以从模型中提供有用的见解，这些模型不能完美地代表它们所建模的现象。

统计模型是使用数学概念对系统的描述。因此，在许多情况下，您会添加一定的抽象层来促进您的推理过程（例如，测量误差的正态性、相关结构中的复合对称性等）。考虑到我们对世界的主观看法，单个模型几乎不可能完美地描述现实世界的现象（我们的感觉系统并不完美）；然而，成功的统计推断确实会发生，因为我们的世界确实具有我们利用的某种程度的一致性。所以我们几乎总是错误的模型证明是有用的。

（我相信你很快就会得到一个大胆的答案，但我试图在这个问题上简洁！）

我找到了 Thad Tarpey 在2009 年的 JSA 演讲，为 Box 段落提供了有用的解释和评论。他认为，如果我们将模型视为对事实的近似，我们可以很容易地称所有模型都是正确的。

这是摘要：

统计学的学生经常被介绍给 George Box 的名言：“所有模型都是错误的，有些是有用的。” 在这次演讲中，我认为这句话虽然有用，但却是错误的。一个不同的、更积极的观点是承认模型只是从数据中提取感兴趣信息的一种手段。事实是无限复杂的，模型只是对事实的近似。如果近似值很差或具有误导性，则该模型是无用的。在这次演讲中，我给出了一些不是真实模型的正确模型的例子。我说明了“错误”模型的概念如何导致错误的结论。

对我来说，真正的洞察力在于以下方面：

模型不一定要正确才能有用。

不幸的是，在许多科学中，经常忘记模型不一定需要是现实的精确表示来允许新的发现和预测！

因此，不要浪费您的时间来构建需要准确测量无数变量的复杂模型。真正的天才发明了一个简单的模型来完成这项工作。

其它你可能感兴趣的问题

上一篇相互信息与相关性下一篇用简单的英语进行交叉验证？