当前按要素对地理空间数据进行聚类的方法是什么?
示例:我有一些人口统计数据集。假设这包含平均房价和人口密度。
因此,这里的一个示例相关性是房价与人口密度。但是,诀窍是如何拉出集群。例如,人口密度高的富裕地区与人口密度低的地区不同。应用基本距离度量不会考虑到这一点,因为低与高可以相互抵消,给出相似的距离。这导致我可能采用某种形式的加权聚类来拉动质心。
不确定哪种方法会考虑到这一点。
当前按要素对地理空间数据进行聚类的方法是什么?
示例:我有一些人口统计数据集。假设这包含平均房价和人口密度。
因此,这里的一个示例相关性是房价与人口密度。但是,诀窍是如何拉出集群。例如,人口密度高的富裕地区与人口密度低的地区不同。应用基本距离度量不会考虑到这一点,因为低与高可以相互抵消,给出相似的距离。这导致我可能采用某种形式的加权聚类来拉动质心。
不确定哪种方法会考虑到这一点。
我假设您正在尝试根据不同区域的特征找到合适的距离度量(尽管空间距离也可能很容易插入)。在这种情况下,我会首先尝试确保正确缩放不同的特征,例如,零均值和单位方差。
如果结果看起来不正确,我也会尝试查看不同的距离指标。一个简单的替代示例是L1 范数:
L1(a, b) = sum_x |x_a - x_b|