数据挖掘 - 如何实时计算递增序列的临时/周期性相似度？ - 吾爱随笔录

如何实时计算递增序列的临时/周期性相似度？

数据挖掘时间序列相关性

2022-03-06 03:16:02

考虑到随着时间的推移有两个系列，并且新数据在 n 秒的间隙内添加到系列中。该系列本身可能具有周期性的相似性/不相似性。如何实时计算序列值之间的相关性？

1个回答

好吧，这是一个有趣的问题！让我们再次制定它以准确回答：

我有两个实时值流。两者之间存在暂时的相似性（瞬态相似性）。如何捕捉它？

当您谈论相似性时，我没有将范围限制为相关性。可以定义另一种相似性度量。我会说你应该首先定义你的相似性函数（你可以选择相关性。我的例子也是如此）和一段时间的检查（它只是一个长度窗口 $m$ 结束于当前时间戳）。

使用这两个并从 $m+1$ 第一个样本，您可以将相似性度量（此处为相关性）计算为时间序列。这个时间序列开始于 $m$ 输入系列的第一个样本，因此请记住保持相似性度量和原始时间戳同步。输出中两个连续点之间的间隔（相似性系列）是根据您需要的分辨率定义的。后 $m+1$ 您可以逐步移动您的窗口并相应地计算相似度。然后输出中的间隔将与输入相同。

当然，它使您远离实时，因为计算的频率和数量是最大的。您可以为自己定义一个保证金（假设 $d$ 样本）并计算相似度 $d$ 时间。然后你会丢失一些信息（丢弃中间的样本）但你会更接近实时（你会有 $d*n$ 秒来执行计算）。

如果需要澄清，请告诉我。欢迎来到社区顺便说一句:)

其它你可能感兴趣的问题

上一篇具有几乎相同特征但输出不同的训练示例会导致机器学习分类算法表现不佳吗？下一篇如何定义成本函数？