我有一个在同一时间段内发生的事件的数据集。每个事件都有一个类型(有几种不同的类型,少于十个)和一个位置,表示为 2D 点。
我想检查事件类型之间或类型和位置之间是否存在任何关联。例如,也许 A 类型的事件通常不会在 B 类型的事件发生的地方发生。或者,也许在某些地区,主要是 C 类事件。
我可以使用什么样的工具来执行此操作?作为统计分析的新手,我的第一个想法是在这个数据集上使用某种 PCA(主成分分析)来查看每种类型的事件是否有自己的成分,或者是否有一些共享相同(即相关)?
我不得不提到我的数据集大约是 500'000 点,从而使事情变得更难处理。
编辑:正如下面的答案和评论中所指出的,要走的路是将其建模为一个标记点过程,然后使用 R 来完成所有繁重的工作,如本研讨会报告中的详细说明:http:/ /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html