点过程互相关分析

机器算法验证 点过程 互相关
2022-01-25 05:29:25

我想对我正在使用的分析方法提出建议,以了解它在统计上是否合理。

我测量了两点过程T1=t11,t21,...,tn1T2=t12,t22,...,tm2我想确定事件是否在T1以某种方式与事件相关T2.

我在文献中发现的一种方法是构建互相关直方图:对于每个tn1我们发现所有事件的延迟T2落在给定的时间窗口(之前和之后tn1),然后我们构建所有这些延迟的直方图。

如果这两个过程不相关,我会期望一个平坦的直方图,作为发生事件的概率T2在事件之后(或之前)T1在所有延迟时都相等。另一方面,如果直方图中存在峰值,则表明两点过程以某种方式相互影响(或者至少有一些共同的输入)。

现在,这很好,但是我如何确定直方图是否确实有一个峰值(我不得不说,对于我的特定数据集,它们显然是平坦的,但如果有一个统计方法仍然会很好确认)?

所以,这就是我所做的:我已经重复了生成直方图的过程几(1000)次,保持T1照原样并使用“洗牌”版本T2. 洗牌T2我计算所有事件之间的间隔,将它们打乱并求和以重新构成一个新的点过程。在 RI 中,只需执行以下操作:

times2.swp <- cumsum(sample(diff(times2)))

所以,我最终得到了 1000 个新的直方图,它向我展示了事件的密度T2相比T1.

对于这些直方图的每个分箱(它们都以相同的方式分箱),我计算了直方图 95% 的密度。换句话说,我是说,例如:在时间延迟 5 毫秒时,在 95% 的洗牌点过程中,有概率 x 在T2在某事件之后T1.

然后,我会将所有时间延迟的 95% 值用作一些“置信限制”(可能这不是正确的术语),以便在原始直方图中超出此限制的任何内容都可以被视为“真实顶峰”。

问题1:这种方法在统计上是否正确?如果不是,你将如何解决这个问题?

问题 2:我想看看的另一件事是我的数据是否存在“更长”类型的相关性。例如,两点过程中的事件发生率可能会有类似的变化(请注意,它们可能有完全不同的发生率),但我不知道该怎么做。我想使用某种平滑内核为每个点过程创建一个“包络”,然后对两个包络进行互相关分析。你能建议任何其他可能的分析类型吗?

谢谢你,很抱歉这个很长的问题。

1个回答

在二维或更多维中分析此问题的标准方法是Ripley's (cross) K function,但也没有理由不在一维中使用它。(谷歌搜索在挖掘参考方面做得很好。)本质上,它绘制了两个实现中点之间所有距离的 CDF,而不是这些距离的 PDF 的近似直方图。(一个变体,L 函数,绘制了两个均匀不相关过程的 K 和零分布之间的差异。)这巧妙地回避了您面临的大多数问题,例如选择箱、平滑等。K 的置信带通常是通过模拟创建的。这在 R 中很容易做到。R 的许多空间统计数据包可以直接使用或很容易适应这种一维情况。罗杰·比万德CRAN 上的概述页面列出了这些包:请参阅“点模式分析”部分。