DTW(动态时间规整)需要事先归一化吗?

数据挖掘 时间序列
2021-09-14 10:20:35

我正在尝试来自 mlpy 的 DTW,以检查时间序列之间的相似性。

在使用 DTW 处理系列之前,我应该对系列进行规范化吗?还是有点宽容,我可以按原样使用该系列?

所有时间序列都存储在 Pandas Dataframe 中,每个都在一列中。大小小于 10k 点。

2个回答

我很高兴你问;-)

在 99% 的情况下,您必须进行 z 归一化。

想知道为什么?我为此写了一个教程,第 46 页 http://www.cs.unm.edu/~mueen/DTW.pdf

DTW 通常使用符号之间的距离,例如曼哈顿距离 (d(X,是的)=|X-是的|)。无论符号是样本还是特征,它们都可能需要幅度(或至少)归一化。他们应该吗?我希望我能在所有情况下回答这样的问题。但是,您可以在以下位置找到一些提示: