如何根据特征+位置的相似性对房屋进行聚类?

数据挖掘 r 聚类 相似
2022-02-25 15:49:27

我有一个这样的房屋数据集:

HouseID  Latitude Longitude PriceIndex
  1          1.4     103.120    1.21
  2          1.42    103.112    2.01 

我想根据它们的位置和价格指数找到彼此相似的房子。[还需要按相似性的顺序排列,给定一所房子]我尝试在 R 中使用 hclust 包并且能够提取9个类。然而,这些群体似乎没有任何可解释的相似之处(例如,这些点遍布整个城市等)。我之前没有做过基于集群的项目,所以任何朝着正确方向的帮助都会有所帮助。谢谢!

编辑:从聚类数据集中删除价格索引列实际上是空间聚类。但添加价格仅显示基于价格的聚类

1个回答

检查尺寸范围,如果发现差异很大,请考虑缩放。

如果索引是其他两个维度,我会解释你描述的行为,因为范围要大得多。另请参阅问题