统计检验以查看关系是线性的还是非线性的

机器算法验证 r 假设检验 非线性回归 拟合优度 异方差
2022-03-23 18:37:01

我有一个示例数据集如下:

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

在此处输入图像描述

从图中可以看出,在一定范围的“音量”和“功率”之间,关系是线性的,当“音量”变得相对较小时,关系就变成了非线性关系。是否有统计测试来说明这一点?

关于对 OP 的回复中显示的一些建议:

此处显示的示例只是一个示例,我拥有的数据集看起来与此处看到的关系相似,但噪音更大。到目前为止,我进行的分析表明,当我分析特定液体的体积时,当体积较小时,信号的功率会急剧增加。所以,假设我只有一个音量在 15 到 20 之间的环境,它看起来几乎是线性关系。然而,通过增加点的范围,即具有更小的体积,我们看到这种关系根本不是线性的。我现在正在寻找一些关于如何统计显示这一点的统计建议。希望这是有道理的。

3个回答

这基本上是一个模型选择问题。我鼓励您选择一组物理上合理的模型(线性、指数,可能是不连续的线性关系),并使用 Akaike 信息准则或贝叶斯信息准则来选择最佳模型 - 请记住 @whuber 指出的异方差问题。

你试过用谷歌搜索这个!?一种方法是为您的模型拟合更高的功率或其他非线性项,并测试它们的系数是否与 0 显着不同。

这里有一些例子http://www.albany.edu/~po467/EPI553/Fall_2006/regression_assumptions.pdf

在您的情况下,您可能希望将数据集分成两部分,以测试体积 < 5 的非线性和体积 > 5 的线性。

您遇到的另一个问题是您的数据是异方差的,这违反了回归数据的正态假设。提供的链接还提供了对此进行测试的示例。

我建议使用非线性回归将一个模型拟合到所有数据。选择任意体积并将一个模型拟合到小于该体积的体积而将另一个模型拟合到更大的体积有什么意义?除了图的外观之外,是否有任何理由使用 5 作为临界阈值?您真的相信在特定音量阈值之后,理想曲线是线性的吗?随着音量的增加,它不是更有可能接近水平,但从来都不是线性的吗?

当然,分析工具的选择必须取决于您试图回答的科学问题以及您对系统的先验知识。