当数据值的范围较小时可以使用更简单的模型的想法的参考

机器算法验证 造型 参考
2022-03-19 01:08:40

当我们建立一个统计物理模型时,一般来说,当数据值的范围较小时,可以证明一个更简单的模型是合理的。

我不能成为第一个使用这个想法的人,但我也找不到任何地方提到它。

作为我所说的一个简单的例子,考虑一块落下的岩石。如果岩石仅下落一米,则恒定恒定加速度模型可能有用。如果岩石掉落一公里,那么我可能需要考虑空气动力学。如果岩石下落 1000 公里,就需要有轨道力学。

我的实际情况不涉及落石,但我确实建议限制数据值的范围作为管理模型所需复杂性的一种手段。

任何人都可以回忆起这个概念的名称 - 或建议参考吗?

1个回答

我认为这不是一个可参考的概念,它只是相对错误。您所说的“数据值范围”通常称为“尺度”,您只会说某个理论足以描述这个尺度。在岩石的例子中,F=mg足以描述岩石的动力学,从这个意义上说,你的理论误差小于典型的测量误差。在这种特殊情况下,称为线性化,当你有非线性运动方程并且你想在一个小社区中使用它们时是典型的。

在统计学中,我会看到一个等效的错误度量,其中包含模型参数数量的成本(例如,Akaike 或贝叶斯信息标准)。您使用不同数量的参数测量模型所产生的错误,并且在某些时候,您为添加新参数而减少的错误不足以补偿您预定义的成本;不过要小心那些,因为成本的定义是至关重要的。