我正在尝试来自 mlpy 的 DTW,以检查时间序列之间的相似性。
在使用 DTW 处理系列之前,我应该对系列进行规范化吗?还是有点宽容,我可以按原样使用该系列?
所有时间序列都存储在 Pandas Dataframe 中,每个都在一列中。大小小于 10k 点。
我正在尝试来自 mlpy 的 DTW,以检查时间序列之间的相似性。
在使用 DTW 处理系列之前,我应该对系列进行规范化吗?还是有点宽容,我可以按原样使用该系列?
所有时间序列都存储在 Pandas Dataframe 中,每个都在一列中。大小小于 10k 点。
DTW 通常使用符号之间的距离,例如曼哈顿距离 )。无论符号是样本还是特征,它们都可能需要幅度(或至少)归一化。他们应该吗?我希望我能在所有情况下回答这样的问题。但是,您可以在以下位置找到一些提示: