我正在做一个项目,我有很多高维点,我想找到它们中最密集的邻域。理想情况下,在我的 ~500 个点中,每个点都是一个 4x300 矩阵(四个变量的 300 ms 时间序列),我想找到最相似的 ~30 个点。我研究了 k 最近邻方法,但这些方法都在寻找某个点的最小邻域,我希望能够指定邻域的大小 N(有多少数据点)并获得子集 N 个点最接近。
我认为(?)这是一个聚类问题,所以我研究了使用更相关维度进行聚类的软子空间聚类,并且我研究了专门为时间序列数据开发的双聚类。
任何帮助将不胜感激!我有一个问题,我确定其他人已经想到了,但我认为我不知道确切的措辞,到目前为止我所看到的一切都很接近,但不完全是我需要的。因此,任何能给我有关如何解决此问题的信息的论文/代码/教程/等都很棒:D
更新:我已经研究过使用Frechet 距离作为时间序列之间的距离。这是否是用于此类数据的合适指标?