将指数移动平均线调整为移动窗口意味着什么?

机器算法验证 指数平滑 移动平均线 校准 移动窗口
2022-03-21 17:17:23

指数移动平均线的 alpha 参数定义了平均应用于时间序列的平滑度。以类似的方式,移动窗口均值的窗口大小也定义了平滑。

是否有某种方法可以调整 alpha 参数,以使平滑与给定大小的移动窗口平均值大致相同?(显然,不寻找相同的结果,并且偏移量是可以的)。那么,说调整 alpha 以使生成的时间序列在形状上尽可能接近 3 个月移动窗口提供的结果?

编辑:上下文:我正在尝试从降雨数据中生成土壤水分的多个代理,这些数据抽象地代表不同的深度(我假设这与长期降雨平均值有关)。移动窗口允许我计算过去 3 天、3 个月或一年的总降雨量,这可能分别对应于顶部几厘米的土壤、顶部米和延伸的土壤柱。但是,移动窗口需要过去的数据,而这些数据并不总是可用的(例如,在系列开始时)。如果改为使用指数平均值,那么我只需要为每个平均值存储一个值(上一个时间步的平均值),这个值可以用长期平均值初始化。

4个回答

x是原始时间序列和xm是使用具有一些窗口宽度的简单移动平均线平滑的结果。f(x,α)是一个返回平滑版本的函数x使用平滑参数α.

定义损失函数L衡量窗口移动平均线和指数移动平均线之间的差异。一个简单的选择是平方误差:

L(α)=xmf(x,α)2

如果您希望错误对移位/缩放保持不变,您可以定义L类似于归一化互相关的峰高的负值。

找到价值α最小化L

minαL(α)

这是一个使用噪声正弦信号和均方误差作为损失函数的示例:

在此处输入图像描述

另一个使用白噪声作为信号的例子:

在此处输入图像描述

损失函数似乎表现良好,并且对于这两个不同的信号有一个全局最小值,这表明标准的 1d 优化求解器可以工作(就像我在这里选择的那样但是,我还没有证实一定是这样。如果有疑问,请绘制损失函数并在必要时使用更复杂的优化方法。α

编辑

这是作为窗口大小函数(用于简单移动平均)的最佳 alpha(用于指数平滑)的图。为上面显示的每个信号绘制。

在此处输入图像描述

如果我正确理解了这个问题,那么问题是试图使呈指数下降的权重系列适合离散均匀(具有截止的恒定权重):

![EWMA权重函数与普通移动平均线的比较

显然,EWMA 要么快速下降(在普通移动平均线仍然具有高权重的较旧滞后处严重拟合),要么在过去更远的地方出现尾部,在普通移动平均线没有权重的情况下严重拟合权重分布)。

究竟哪种选择最能匹配来自统一权重的结果将关键取决于您如何衡量性能以及(自然地)取决于系列的特征(普通移动平均线和 EWMA 仅合理地适用于弱-例如,平稳序列,但它涵盖了许多情况,对于不同的值可能具有不同的相对性能)αα

这个问题使这两件事都含糊不清,所以我怀疑除了“它取决于”之外没有什么要说的了——关于条件均值的相似性或条件方差的大小,在这里。

我们可以将其视为超参数优化问题。

我们有一个目标 X_mean,它是目标值。

我们还有一个损失函数,例如 L2 (X_exponential - X_mean)。

我们正在寻找指数移动平均线的超参数 (alpha) 以最小化损失。

指数移动平均线( ) 是一个IIR 滤波器:无限脉冲响应,这意味着,从技术上讲,EMA 的“权重”向量无限长的,因为在前一个时间步长中使用自己的输出作为输入当前一个:EMAEMAEMA

EMA= α Close + (1 α ) EMA[1]

和:

  • EMA[1]上一步中 EMA 的值
  • Close输入信号的值。

但是,您可以根据所需的小数位数来近似具有有限窗口长度 :我指的是这个线程。EMAn

众所周知,EMA 的alpha长度相关联,如下所示:αEMAn

α =2/(n+1)

或者

n= (2/ α)1

因此,即将对应于的窗口将对应于0.181818α0.1n19n=10α0.181818...

权重的一般形状看起来像这样(尽管我会以相反的顺序绘制它们,因为如果它是一个因果过滤器,窗口会从左到右在时间序列上滑动)。EMA

关于这个问题的有趣之处在于,所有这些不同类型的移动平均线(SMA、EMA、LWMA、HMA,...)一旦你用滞后函数来表达它们,它们或多或少是相同的。我指的是这个线程。