这是我在分析包含固定时间间隔内城市中所有犯罪地点的数据集时遇到的问题,尽管它可能会出现在其他类型的点过程中。问题与没有准确观察到犯罪地点有关。他们位于警方在报告中写下的任何街道地址。在我的研究城市(可能几乎所有城市)中,景观中存在“天然屏障”,使这些“位置”本质上是不精确的。
例如,假设城市中心有一个大型自然保护区/公园。然后,自然保护区内发生的所有犯罪都被映射到一个地址 - 大概是自然保护区主要办公室的地址。这种“审查”会导致数据集中的人为聚类,并且很可能会使强度函数的估计和相关的协变量效应等产生偏差。我想这种“天然屏障”几乎存在于任何城市所以这个问题可能是由其他研究人员煽动的,所以我的问题是:是否有处理此类数据的已知方法?
目前,我已经使用普通的非齐次泊松过程模型分析了这个数据集,并得到了一些有趣的结果。我真的认为这些结果是“真实的”,基于之前的描述性分析等等尽管观测数据的经验密度与在拟合模型下模拟的数据的经验密度相当接近,但“拟合优度”检验的结果。
以下是我考虑过的主要可能性(以及我决定反对它们的原因):
从观察窗口中删除这些“自然障碍”,并将其视为网格上的点过程。我不想这样做,因为它从根本上改变了您正在估计的参数,并且有效地扫除了地毯下的“审查”问题。
将数据分类为区域单位(例如基于人口普查的组),因为这种审查很少跨越人口普查边界。在某些情况下,这可能是一个很好的解决方案,但过度平滑是一个问题,更重要的是,我正在与之合作的城市太小(没有足够的人口普查单位)无法做到这一点。
为此开发我自己的模型。我很确定这是我必须做的,但我想先检查一下我没有重新发明轮子。根据我自己的文献搜索,我不是,但这里的一些专家可能知道一些我不知道的事情。