考虑到随着时间的推移有两个系列,并且新数据在 n 秒的间隙内添加到系列中。该系列本身可能具有周期性的相似性/不相似性。如何实时计算序列值之间的相关性?
如何实时计算递增序列的临时/周期性相似度?
数据挖掘
时间序列
相关性
2022-03-06 03:16:02
1个回答
好吧,这是一个有趣的问题!让我们再次制定它以准确回答:
我有两个实时值流。两者之间存在暂时的相似性(瞬态相似性)。如何捕捉它?
当您谈论相似性时,我没有将范围限制为相关性。可以定义另一种相似性度量。我会说你应该首先定义你的相似性函数(你可以选择相关性。我的例子也是如此)和一段时间的检查(它只是一个长度窗口结束于当前时间戳)。
使用这两个并从第一个样本,您可以将相似性度量(此处为相关性)计算为时间序列。这个时间序列开始于输入系列的第一个样本,因此请记住保持相似性度量和原始时间戳同步。输出中两个连续点之间的间隔(相似性系列)是根据您需要的分辨率定义的。后您可以逐步移动您的窗口并相应地计算相似度。然后输出中的间隔将与输入相同。
当然,它使您远离实时,因为计算的频率和数量是最大的。您可以为自己定义一个保证金(假设样本)并计算相似度时间。然后你会丢失一些信息(丢弃中间的样本)但你会更接近实时(你会有秒来执行计算)。
如果需要澄清,请告诉我。欢迎来到社区顺便说一句:)
其它你可能感兴趣的问题