使用 GLM 估计泊松过程强度

机器算法验证 广义线性模型 泊松过程 间隔时间
2022-04-19 07:36:34

的非齐次泊松过程生成的事件建立一个解释模型我的数据集中的每个条目都代表一个事件的注册:时间、位置和一些解释变量条目按时间顺序排列。我想使用 GLM 估计解释变量对泊松过程强度的影响。λti(xi,yi)zi1,...,zip,i=1,...,n

不能对条目进行分组,因为这不可避免地会导致解释性信息的丢失。因此,具有泊松回归的计数模型在这种情况下不起作用。

但是,如果我们假设逗留时间(我们可以在这个数据集中计算)是指数 iid,我们可以应用 Gamma 回归。请暂时忽略我们由于差异而失去一个观察结果。使用日志链接,这变成si

E[si|zi]=exp(β0+β1zi1+...+βpzip)=λ(zi1,...,zip)

(编辑)由于解释性数据分析表明该过程在时间和二维空间上都是不均匀的,因此我还将位置坐标包括在线性分量中:

E[si|zi,xi,yi]=exp(β0+β1zi1+...+βpzip+γ1xi+γ2yi)=λ(zi1,...,zip,xi,yi)

问题:

  1. 这种方法有效吗?
  2. 鉴于泊松过程是不均匀的,我可以假设逗留时间是指数 iid 吗?
  3. 是否确实模拟了过程的强度?E[si|zi,xi,yi]
  4. 我是在建模一维(时间)、三维(时间和位置)还是维泊松过程?p+2
1个回答

鉴于泊松过程是不均匀的,我可以假设逗留时间是指数 iid 吗?

通常,事件间间隔不会呈指数分布。Yakovlev 等人的这篇论文(2008) 推导出一维非齐次泊松分布的事件间分布表达式(方程 6)并给出反例(例如方程 8)。

我是在建模一维(时间)、三维(时间和位置)还是维泊松过程?p+2

我猜你想模拟一个三维过程。它不是一维的,因为对于不同的位置会有不同的速率 y) 。另一方面,它不是维的,因为您可能只观察到每个时间和位置的一个,因此知道意味着知道当然你可能会假设像,但我仍将其称为三维过程。λ(t,x,y)(x,y)(p+2)z(t,x,y)zλ(t,x,y)=λ(ztxy)λ(t,x,y)=λ(ztxy,x,y)