数据挖掘 - 在 n 个不同的值上进行特征选择 - 吾爱随笔录

我有一个.csv文件，其中包含以下形式的数据：

moment_1;moment_2;moment_3;force_x;force_y;force_z;...
-0,02131267;-1,6032766088;5,9906811787;5,40010285;0,0203;86,44227467;...
2599;-1,70091039344;-1,3044809;-0,0406673590;-2,60896180797;43,2334;...

该文件非常大，我需要将其放入交互式可视化中，这就是为什么我需要在不过多改变整体结构的情况下减少数据点。

许多数据点彼此非常接近，如下图所示：

我的方法是定义一个阈值并过滤所有与前一点的距离低于阈值的点。但我认为这不是最佳解决方案，因为当我删除一个索引时，我也需要从另一个数据数组中删除它，否则结构会改变。

有更好的方法吗？