我有一组海表温度 (SST) 月度数据,我想应用一些聚类方法来检测具有相似 SST 模式的区域。我有一组从 1985 年到 2009 年运行的月度数据文件,并希望将集群应用于每个月作为第一步。
每个文件包含 358416 个点的网格数据,其中大约 50% 是土地,并标有 99.99 值,即 NA。数据格式为:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
我已经尝试过 CLARA 聚类方法并得到了一些明显不错的结果,但在我看来这也只是平滑(分组)等值线。然后我不确定这是分析空间数据的最佳聚类方法。
有没有其他专门用于此类数据集的聚类方法?一些参考资料会很好地开始阅读。
提前致谢。