围绕逻辑增长数据的误差分布是什么?

机器算法验证 r 分布 密度函数 生态
2022-03-01 22:57:02

在生态学中,我们经常使用逻辑增长方程:

Nt=KN0ertK+N0ert1

或者

Nt=KN0N0+(KN0)ert

其中是承载能力(达到的最大密度),是初始密度,是增长率,是自初始以来的时间。KN0rt

的值有一个软上界和一个下界处有一个强下界Nt(K)(N0)0

此外,在我的具体情况下,的测量是使用光密度或荧光完成的,两者都有一个理论最大值,因此有一个很强的上限。Nt

周围的误差可能最好用有界分布来描述。Nt

值较小时,分布可能具有很强的正偏斜,而在接近 K 时,分布可能具有很强的负偏斜。因此,分布可能具有可以链接到的形状参数。NtNtNt

方差也可能随着增加。Nt

这是一个图形示例

在此处输入图像描述

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

可以在 r 中用

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • 周围的理论误差分布是多少(考虑到模型和提供的经验信息)?Nt

  • 这个分布的参数如何与或时间的值相关(如果使用参数是模式不能直接与相关联,例如 logis normal)?NtNt

  • 中实现的密度函数R

目前探索的方向:

  • 假设周围的正态性(导致的高估)NtK
  • 的Logit 正态分布,但难以拟合形状参数 alpha 和 betaNt/max
  • 围绕Nt/max
2个回答

正如 Michael Chernick 指出的那样,按比例缩放的 beta 分布对此最有意义。但是,出于所有实际目的,并期望您永远不会让模型完全正确,您最好根据逻辑增长方程通过非线性回归对平均值进行建模,并用对异方差稳健的标准误差进行总结。将其置于最大似然上下文中会产生一种非常准确的错误感觉。如果生态理论会产生一个分布,你应该拟合那个分布。如果你的理论只产生平均值的预测,你应该坚持这种解释,不要试图提出更多的东西,比如一个成熟的分布。(皮尔逊的曲线系统在 100 年前肯定很奇特,但随机过程不遵循微分方程来产生密度曲线,这是他制作这些密度曲线的动机——相反,Nt本身——我以泊松分布为例——我不完全确定这种效应是否会被缩放的 beta 分布捕捉到;相反,当您将平均值拉向其理论上限时,它会被压缩,您可能必须这样做。如果您的测量设备具有测量值的上限​​,这并不意味着您的实际过程必须有一个上限;我宁愿说,随着过程达到合理准确测量的上限,您的设备引入的测量误差变得至关重要。如果您将测量与基础过程混淆,您应该明确地认识到这一点,但我想您对过程的兴趣比描述您的设备如何工作更感兴趣。(该过程将在 10 年后进行;新的测量设备可能会出现,因此您的工作将变得过时。)

@whuber 是正确的,该模型的结构部分与误差项的分布没有必然关系。因此,对于理论误差分布的问题没有答案。

但这并不意味着这不是一个好问题——只是答案必须在很大程度上是经验性的。

您似乎在假设随机性是相加的。我认为没有理由(除了计算方便)会出现这种情况。模型中其他地方是否存在随机元素?例如,请参见以下内容,其中随机性被引入为均值为 1 的正态分布,唯一要估计的就是方差。我没有理由认为这是正确的做法,除了它会产生看似与您想要看到的结果相匹配的合理结果。使用这样的东西作为估计模型的基础是否可行,我不知道。

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

在此处输入图像描述