数据挖掘 - DTW（动态时间规整）需要事先归一化吗？ - 吾爱随笔录

数据挖掘时间序列

2021-09-14 10:20:35

我正在尝试来自 mlpy 的 DTW，以检查时间序列之间的相似性。

在使用 DTW 处理系列之前，我应该对系列进行规范化吗？还是有点宽容，我可以按原样使用该系列？

所有时间序列都存储在 Pandas Dataframe 中，每个都在一列中。大小小于 10k 点。

2个回答

我很高兴你问;-)

在 99% 的情况下，您必须进行 z 归一化。

想知道为什么？我为此写了一个教程，第 46 页 http://www.cs.unm.edu/~mueen/DTW.pdf

DTW 通常使用符号之间的距离，例如曼哈顿距离 $(d(x, y) = {\displaystyle |x-y|}$ ）。无论符号是样本还是特征，它们都可能需要幅度（或至少）归一化。他们应该吗？我希望我能在所有情况下回答这样的问题。但是，您可以在以下位置找到一些提示：

其它你可能感兴趣的问题