背景: 我正在为一组 60 名参与者建模时间(1 到 30)和 DV 之间的关系。每个参与者都有自己的时间序列。对于每个参与者,我正在检查非线性回归框架内 5 个不同的理论上合理的函数的拟合度。一个函数有一个参数;三个函数有三个参数;一个函数有五个参数。
我想使用决策规则来确定哪个函数提供了最“理论上有意义”的拟合。但是,我不想奖励过度拟合。
过度拟合似乎有两种。一种形式是标准意义,其中一个附加参数可以解释更多的随机方差。第二个意义是存在异常值或其他一些轻微的系统效应,这在理论上没有什么意义。具有更多参数的函数有时似乎能够捕获这些异常并获得奖励。
我最初使用 AIC。而且我还尝试过增加对参数的惩罚。除了使用: []; 我也试过(我称之为 AICPenalized)。我检查了带有拟合线的散点图以及基于 AIC 和 AICPenalised 的相应建议。AIC 和 AICPenalised 都提供了合理的建议。大约 80% 的时间他们同意。然而,在他们不同意的地方,AICPenalised 似乎提出了更具理论意义的建议。
问题: 给定一组非线性回归函数拟合:
- 什么是确定非线性回归中最佳拟合函数的好标准?
- 调整参数数量的惩罚的原则方法是什么?