回归和机器学习在自然科学中用于检验假设、估计参数并通过将模型拟合到数据来进行预测。但是,当我有一个先验模型时,我不想进行任何拟合——例如,根据第一原理计算的确定性物理系统的模型。我只是想知道我的模型与数据的匹配程度,然后了解模型的哪些部分对匹配有显着贡献。有人可以指出我在统计上严格的方法吗?
更具体地说,假设我有一个物理系统,我在三个自变量 { 1 {和。尽管生成数据的真实系统很复杂,但我做了一些简化假设来推导出系统的理论模型,这样
,
其中是自变量的非线性(且不可线性化)函数,而是模型预测值和测量值之间的差异。是完全预先指定的;没有进行拟合,也没有估计参数。我的第一个目标是确定是否是产生测量值的过程的合理模型。
我还开发了简化模型和,它们嵌套在中(如果在这种情况下很重要)。我的第二个目标是确定与数据的匹配是否明显优于或,这表明将模型与模型和的过程中起着重要作用。
到目前为止的想法
也许如果有某种方法可以确定我的数学模型的参数数量或自由度数量,则可以使用现有程序,如似然比检验或 AIC 比较。但是,鉴于的非线性形式并且没有任何明显的参数,我不确定分配参数或假设什么构成自由度是否合理。
我读过拟合优度的度量,例如决定系数 ( ),可用于比较模型性能。但是,我不清楚值之间有意义差异的阈值可能是多少。此外,因为我没有将模型拟合到数据中,所以残差的平均值不为零,并且每个模型可能不同。因此,倾向于低估数据的良好匹配模型可能会产生与无偏但与数据匹配不佳的模型
我也读过一些关于拟合优度测试的文章(例如,Anderson-Darling),但由于统计不是我的领域,我不确定这种类型的测试是否适合我的目的。任何指导将不胜感激。