空间点过程:不均匀的一阶强度函数是否会影响二阶相关性?

机器算法验证 空间的 点过程
2022-04-09 03:14:24

正如标题所示,我对一阶强度函数的影响有些困惑。如果我有一个一阶强度函数,表示在某个区域中点更有可能出现,这意味着在该区域中会出现更多的点,并且看起来这些点在该区域中聚集,随后表明在该区域中,点模式是聚集的。因此,似乎一阶强度的不均匀性会影响二阶强度。

我的理解是,一阶强度函数指定了点出现的一般强度水平。然后基于该强度,与相同强度的泊松过程相比,某个区域中的点是聚集的还是排斥的,然后由二阶强度函数确定。

如果我的理解是正确的,那么如果我们尽可能详细地描述一阶强度,那么任何点模式都可以被视为非齐次泊松过程。但当然,这将是过度拟合的情况。

这种理解正确吗?

2个回答

一阶强度和二阶强度测量几乎可以独立变化的过程的不同方面。 特别是,并不是每个点过程都可以看作是非齐次泊松过程。

让我们先处理最后一个问题。考虑区间 差距将倾向于遵循指数分布。让我们将其与倾向于保持更均匀间距的过程进行比较,即“分层随机”过程。它是通过将间隔划分为一千个不重叠的 bin 并在每个 bin 内选择一个均匀随机的点来创建的。它们具有相同的一阶强度,正如这些来自每个过程的单一实现的估计所示:[0,1].

图1

这些过程很容易通过检查连续值之间的间隔来区分:

图 2

确实,某些形式的“聚类”可以用二阶强度来表征——但不是全部。聚类可能意味着两件事的任意组合:

  1. 附近的“一阶”聚类仅意味着在所有实现的邻域中往往有更多的点。ss

  2. 附近的“二阶”聚类意味着 s 附近的点的出现与附近其他位置的点的出现相关联sss.

这听起来很微妙,所以让我们对比一些例子。我已经产生了两个过程的实现:一个是不均匀的,在区间上的强度比在区间上的强度大五倍;另一个同样不均匀但聚集在区间中。 为了生成后者,我创建了一个 iid 指数变量的序列,将它们中的每五个乘以并计算它们的累积和最后除以它们的总和的两倍以放置它们在 区间(0,1/2](1/2,1](0,1/2]dXi100,Xi,(0,1/2].(1/2,1]和之前一样,是一个齐次泊松过程。这创造了一个过程,其中往往有四个点的紧密组,所有点都彼此相距很远。但是,由于这些点之间的中间间隙是随机的,因此这些集群出现的位置从一个实现到另一个实现往往不相同。当您有机会查看流程的多个实现时,这是区分不均匀性(从一个实现持续到下一个实现)与集群(可能发生在任何地方,不一定在固定位置)的一种方法。

图 3

每个过程的实现显示为底部的地毯图。这些点是对的散点图:也就是说,高度绘制到右侧下一个点的间隙。散点图清楚地区分了这两个过程。(Xi,dXi)

从广义上讲,您的理解听起来是正确的。特别是,您说得对,基于单点模式基本上无法区分“一阶不均匀性”和“由于点之间的相互作用导致的二阶聚类”。