我有一个数据集,其中包含数千行 {latitute, longitude, crime-type} 元组。
样本数据:
41.757366519 -87.642992854 THEFT
41.910469677 -87.585822373 ROBBERY
41.751270452 -87.690708662 BURGLARY
41.757366519 -87.642992854 THEFT
41.757366519 -87.642992854 THEFT
.. .. ..
.. .. ..
我试图根据犯罪类型对这些进行聚类。
例如,如果在任何地区,THEFT 的发生频率都很高,根据数据集,它应该显示为一个集群。我曾尝试仅使用经纬度数据进行聚类,这似乎对这个犯罪数据集没有任何意义。
我对数据挖掘还很陌生,并且逐渐找到了出路。
如何使用纬度和经度值对数据进行聚类,以使聚类通过犯罪类型相互关联?是否有任何工具可以使用经纬度数据并根据犯罪类型对它们进行聚类?否则,一旦我了解如何做到这一点,我什至可以编写一个脚本。
另外,有没有人有过犯罪数据挖掘的经验?我可以通过哪些其他方式从犯罪数据集中找到有趣的模式?
非常感谢!