我正在开展一个项目,该项目旨在根据位置(纬度/经度)和分类变量(特定站点的分区用途)来识别城市发展中的集群。理想情况下,分析将识别 1) 彼此靠近和 2) 分区相同的站点集群。以下是我的数据的示例:
lat lon zone
33.22320 -112.6741 R-43
33.45324 -113.0888 R-43
33.71800 -112.3885 R-43
33.45626 -111.9408 AG
33.45746 -111.9313 R-6
33.45747 -111.9309 R-6
我已经看到使用大圆距离在纬度/经度上定义距离的方法,但我还没有看到任何我试图实现的混合聚类。我对聚类分析相当陌生,因此任何有关在 R 或 Python 中实现此类功能的指导都将不胜感激!