如何为不断增长的数据集的特征缩放执行运行(移动)标准化?

数据挖掘 统计数据 特征缩放
2022-03-11 09:02:42

假设有一个函数r

rn=r(τn) ,

其中表示具有演化状态的系统的所谓时间步长。应该同样影响,因此应该被缩放。问题是,序列随时间增长,因为增长。nρτr(τ1,τ2,,τn)n

如何执行运行 标准化运行均值表达起来比较简单:(τ1,τ2,,τn)

mean(τ)n+1=1n+1[τn+1+Nmean(τ)n]

其中mean(τ)1=τ1

标准化要求

τ~n=τnmean(τ)nσ(τ)n

在哪里

σ(τ)n=1n1i=1n[τimean(τ)n] (1 )

)的标准差(τ1,τ2,,τn)

问题:是否有运行标准差的表达式?在网上我只找到了关于堆栈溢出和 Matlab 函数的 l 墨水,但我不确定哪种算法最适合特征缩放。通过运行(移动),我的意思是不必存储来计算 (1),而是增量更新它。(τ1,τ2,,τn)

1个回答

我想你想要 其中 S、x 和 μ 分别是方差,值和均值。

Sn=Sn1+(xnμn1)(xnμn)

解释和推导参见https://fanf2.user.srcf.net/hermes/doc/antiforgery/stats.pdf