我想对我正在使用的分析方法提出建议,以了解它在统计上是否合理。
我测量了两点过程和我想确定事件是否在以某种方式与事件相关.
我在文献中发现的一种方法是构建互相关直方图:对于每个我们发现所有事件的延迟落在给定的时间窗口(之前和之后),然后我们构建所有这些延迟的直方图。
如果这两个过程不相关,我会期望一个平坦的直方图,作为发生事件的概率在事件之后(或之前)在所有延迟时都相等。另一方面,如果直方图中存在峰值,则表明两点过程以某种方式相互影响(或者至少有一些共同的输入)。
现在,这很好,但是我如何确定直方图是否确实有一个峰值(我不得不说,对于我的特定数据集,它们显然是平坦的,但如果有一个统计方法仍然会很好确认)?
所以,这就是我所做的:我已经重复了生成直方图的过程几(1000)次,保持照原样并使用“洗牌”版本. 洗牌我计算所有事件之间的间隔,将它们打乱并求和以重新构成一个新的点过程。在 RI 中,只需执行以下操作:
times2.swp <- cumsum(sample(diff(times2)))
所以,我最终得到了 1000 个新的直方图,它向我展示了事件的密度相比.
对于这些直方图的每个分箱(它们都以相同的方式分箱),我计算了直方图 95% 的密度。换句话说,我是说,例如:在时间延迟 5 毫秒时,在 95% 的洗牌点过程中,有概率 x 在在某事件之后.
然后,我会将所有时间延迟的 95% 值用作一些“置信限制”(可能这不是正确的术语),以便在原始直方图中超出此限制的任何内容都可以被视为“真实顶峰”。
问题1:这种方法在统计上是否正确?如果不是,你将如何解决这个问题?
问题 2:我想看看的另一件事是我的数据是否存在“更长”类型的相关性。例如,两点过程中的事件发生率可能会有类似的变化(请注意,它们可能有完全不同的发生率),但我不知道该怎么做。我想使用某种平滑内核为每个点过程创建一个“包络”,然后对两个包络进行互相关分析。你能建议任何其他可能的分析类型吗?
谢谢你,很抱歉这个很长的问题。