如何评估特定非线性模型的拟合优度?

机器算法验证 非线性回归 拟合优度 越轨
2022-03-18 00:29:18

我有一个非线性模型y=Φ(f(x,a))+ε, 在哪里Φ是标准正态分布的 cdf,f 是非线性的(见下文)。我想用参数测试这个模型的拟合优度a到我的数据(x1,y1),(x2,y2),,(xn,yn),在使用最大似然估计找到a. 什么是合适的测试?我想使用这个测试将不合适的标签标记为不合适,并确定是否应该收集更多数据。

我已经研究过使用偏差,它将这个模型与饱和模型进行比较,并使用相应的拟合优度检验χn12分配。这合适吗?我读过的关于偏差的大部分内容都适用于 GLM,这不是我所拥有的。如果偏差测试是合适的,需要持有哪些假设才能使测试有效?

更新:f=x1ax2+1为了x>1,a>0如果这有帮助。

3个回答

如果您使用的是 R 平台,请使用库“NP”中的“npcmstest”包。警告:该函数可能需要几分钟来评估您的模型。

您还可以考虑响应分布和预测分布(即 KL 散度、交叉熵等)的信息论比较。

这就是我的做法,基本上是似然比检验。但请记住,它们是理解拟合优度测试的“关键”,是了解您正在测试的替代品类别。现在我们有每个单独数据点的可能性为:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

在哪里g(ϵ)是模型中错误项的可能性,并且fi=xi1axi2+1是第 i 个数据点的模型预测,给定xia. 现在对于每个数据点(xi,yi)我们可以选择一个a这样fi=yi- 你所说的“饱和模型”。所以你是χ2test 在这里是合适的,如果您只想测试具有相同错误可能性的类中的替代方案,g(ϵ),并且您对每个可能性都有独立性(即认识另一个xj,yj对预测没有帮助yi, 给定a)。

在线性回归环境中,拟合优度测试通常针对更复杂的替代方案进行。你有一个线性回归——加入一些多项式来测试线性形式是否足够。由于您已经拥有非线性函数形式,因此您需要考虑的复杂替代方案必须是non-parametric regression我不会尝试提供对该主题的介绍,因为它需要自己的心态,值得单独进行适当的介绍。对于参数与非参数回归的检验,Wooldridge (1992)Hardle 和 Mammen (1993),他们做了非常相似的事情。哈德尔还写了一本关于这个主题的好书。