数据挖掘 - 用于比较两个以上网络数据系列的统计稳健距离测量/度量 - 吾爱随笔录

我有大约 30 个长度不等的列表（其中一些是数据的一式三份），对应于与不同图表的节点相关的指标。我想使用距离度量来比较它们的相似性，但由于数据列表的长度不等，我不确定我可以使用哪种方法。我正在探索使用动态时间扭曲，但想知道是否还有其他更基本的方法。

例如，我正在考虑为每个列表创建具有相同 bin 边缘和 bin 数量的直方图，并使用频率上的距离度量，但我不知道如何使用 python 来解决这个问题，或者是否有一个函数/包已经这样做了。这甚至是一种“好”的方式吗？

我也有兴趣找到一种方法来衡量不同图表之间距离度量的统计显着性。

这是一个问题，我是新手，感谢任何帮助。先感谢您！