分析并生成“块状”分布?

机器算法验证 聚类 空间的 自相关
2022-03-30 22:52:55

是否有分析和生成“块状”分布的标准方法?

  • 分析:给定点云(1d、2d、nd)的块状程度如何,它的块状系数是多少?

  • 生成或合成具有系数 C 的伪随机云

(这些是任何分布系列的基础,例如正态分布。)

自然界中有很多种结块(交通​​堵塞,气候变化的结块),所以它是一个广泛的术语,我想有各种描述尝试和与“经典”统计数据的各种联系。
我正在寻找概述;图片会很好。

10 月 22 日星期五添加:我曾希望找到分析和综合的方法,抽象
<-> 双向真实;当然,广泛的抽象必须同时做到这两点。还在寻找 ...

(专家请加标签)。

4个回答

如果评估空间自相关是您感兴趣的,这里有一篇论文模拟数据并评估 R 中的不同自回归模型。

空间自相关和同步自回归模型的选择 作者 :WD Kissling, G. Carl 全球生态学和生物地理学,卷。17,第 1 期。(2008 年 1 月),第 59-71 页。(此处提供 PDF 文件

不幸的是,他们在 R 中没有用于生成模拟数据的代码,但他们确实有可用的代码来说明如何在补充材料中拟合每个模型。

如果您能更清楚地了解数据的性质,那肯定会有所帮助。许多用于空间分析的技术可能不会在更高维数据中实现,我相信还有其他更适合的技术。某些类型的 K-最近邻技术可能有用,并确保将您的搜索词从块状更改为簇状。

其他一些您可能会觉得有帮助的参考资料。我想以这种方式模拟数据的最佳资源将是 R 程序中的包。

网站 我建议您查看Spatstat R 软件包页面和 R Cran 任务视图以获取空间数据我还建议您查看GeoDa中心页面,您永远不知道OpenSpace Google 小组可能有一些有用的信息。我也遇到了这个关于地理数据的 R 邮件列表,但我目前还没有仔细梳理档案(但我确信那里有有用的数据)。


编辑:对于那些有兴趣在分布中模拟预先指定数量的空间自相关的人,我最近遇到了一篇论文,其中给出了一个非常简单的推荐程序(Dray,2011,第 136 页);

我使用以下步骤获得具有给定自相关级别的样本:(1)生成包含 100 个 iid 正态分布随机值 , (3) 将向量与 (2) 中得到的矩阵预乘以得到向量中的自相关数据(即)。ρy(IρW)1yxx=(IρW)1y

这里唯一没有定义的是是一个先验定义的空间加权矩阵。我不确定这将如何转化为多元案例,但希望它对某人有所帮助!W

引文:

德雷,斯蒂芬。2011. 关于莫兰系数的新观点:空间自相关作为线性回归问题。地理分析43(2):127-141(不幸的是,我没有看到该文件的公开 pdf)

我认为合适的“块状系数”是空间自相关的度量,例如Moran's IGeary's C空间统计不是我的领域,虽然我不知道模拟。

您可以计算空间上的分散度量指数来衡量结块。了解更多信息的一个起点是生态学软件包和文献,以了解它们如何模拟此类事物。

典型的自相关度量,例如 Moran's I,是对结块的全局估计,可能会被趋势或结块的“平均”所掩盖。有两种方法可以处理这个问题:1)使用自相关的局部度量——但缺点是你没有得到一个单一的数字来表示结块。这方面的一个例子是 Local Moran's I* 这是一个文档(来自谷歌搜索),它至少介绍了这些术语并给出了一些推导 http://onlinelibrary.wiley.com/doi/10.1111/0022-4146.00224/abstract

2) 使用专门针对点分布及其在各种空间尺度上的成块性的统计数据,例如 Ripley's K http://scholar.google.com/scholar?q=Ripley%27s+K&hl=en&as_sdt=0&as_vis=1&oi=scholart