我有一个非线性模型, 在哪里是标准正态分布的 cdf,f 是非线性的(见下文)。我想用参数测试这个模型的拟合优度到我的数据,在使用最大似然估计找到. 什么是合适的测试?我想使用这个测试将不合适的标签标记为不合适,并确定是否应该收集更多数据。
我已经研究过使用偏差,它将这个模型与饱和模型进行比较,并使用相应的拟合优度检验分配。这合适吗?我读过的关于偏差的大部分内容都适用于 GLM,这不是我所拥有的。如果偏差测试是合适的,需要持有哪些假设才能使测试有效?
更新:为了如果这有帮助。
我有一个非线性模型, 在哪里是标准正态分布的 cdf,f 是非线性的(见下文)。我想用参数测试这个模型的拟合优度到我的数据,在使用最大似然估计找到. 什么是合适的测试?我想使用这个测试将不合适的标签标记为不合适,并确定是否应该收集更多数据。
我已经研究过使用偏差,它将这个模型与饱和模型进行比较,并使用相应的拟合优度检验分配。这合适吗?我读过的关于偏差的大部分内容都适用于 GLM,这不是我所拥有的。如果偏差测试是合适的,需要持有哪些假设才能使测试有效?
更新:为了如果这有帮助。
如果您使用的是 R 平台,请使用库“NP”中的“npcmstest”包。警告:该函数可能需要几分钟来评估您的模型。
您还可以考虑响应分布和预测分布(即 KL 散度、交叉熵等)的信息论比较。
这就是我的做法,基本上是似然比检验。但请记住,它们是理解拟合优度测试的“关键”,是了解您正在测试的替代品类别。现在我们有每个单独数据点的可能性为:
在哪里是模型中错误项的可能性,并且是第 i 个数据点的模型预测,给定和. 现在对于每个数据点我们可以选择一个这样- 你所说的“饱和模型”。所以你是test 在这里是合适的,如果您只想测试具有相同错误可能性的类中的替代方案,,并且您对每个可能性都有独立性(即认识另一个对预测没有帮助, 给定)。
在线性回归环境中,拟合优度测试通常针对更复杂的替代方案进行。你有一个线性回归——加入一些多项式来测试线性形式是否足够。由于您已经拥有非线性函数形式,因此您需要考虑的复杂替代方案必须是non-parametric regression。我不会尝试提供对该主题的介绍,因为它需要自己的心态,值得单独进行适当的介绍。对于参数与非参数回归的检验,Wooldridge (1992)或Hardle 和 Mammen (1993),他们做了非常相似的事情。哈德尔还写了一本关于这个主题的好书。