如何处理包含缺失数据的时间序列,这意味着什么?
所以缺失的值并没有错。它是故意丢失的,并且估算这些缺失值将意味着信息丢失。
因此,您可以将其视为“仅在满足条件 y 时才测量 x”之类的东西。在我的例子中,只有在某一天有人对此感兴趣时,才会衡量某个价格。这导致了一个包含数千个数据点的时间序列,其中大约 40% 不包含任何值。
我想使用 1D-CNN 作为异常检测器的一部分,以查找数据中的错误。CNN 提供与实际数据进行比较的预测。如果预测和真实数据点之间的差异高于某个阈值,我想将其标记为异常。(但是 missing_values 没有异常)
我想过使用嵌入来处理缺失值,但不确定这是否是处理此问题的正确方法。