通过泰勒展开的“正确”方法变量( f( X) )var(f(X))

机器算法验证 方差 估计 近似 点估计 增量法
2022-03-22 11:24:44

tl;dr:有两个常用的近似的公式,但一个明显优于另一个。既然它不是“标准的”泰勒展开式,它是从哪里来的,为什么它更好?var(f(X))

细节:为实数随机变量,有一种使用矩的泰勒展开等。这样做会产生以下二阶近似: Xf:RRvar(f(X))Ef(X)Ef2(X)

var(f(X))[f(EX)]2var(X)[f(EX)]24var2(X):=V1.

有关正式证明,请参阅此帖子和答案奇怪的是,这不是相应维基百科页面中引用的公式

var(f(X))[f(EX)]2var(X)+[f(EX)]22var2(X):=V2.

注意第二项系数的差异:1/4+1/2

起初,我认为这是维基百科页面中的错字。然而,在运行一些快速模拟之后,似乎第二个近似值好得多(诚​​然,我没有进行详尽的测试,但经过几十个示例后,差异非常明显。)V2V1

事实上,这里是为什么经常发生灾难性失败的部分解释:如果,则据推测,这可以通过使用三阶近似来纠正。V1f(EX)0V1<0

不过,我的问题是(a) 我们如何推导出,以及 (b) 为什么它的表现优于V2V1

1个回答

我不能谈论第一个近似值的推导(这对我来说看起来是错误的)。的二阶泰勒近似获得的,用于基础分布居中、无偏斜和中峰的情况。在这种情况下,您有使用您获得的泰勒近似的一般形式:fμ=0γ=0κ=3

V[f(X)](f(μ)2μ2f(μ)f(μ)μ+f(μ)2)σ2f(μ)(f(μ)+μf(μ))2γσ3+f(μ)24(κ1)σ4=f(μ)2σ2+f(μ)22σ4.

第一个近似值对我来说看起来不正确,我没有看到任何证据表明它是“常见的公式”。对于任何假设的峰度水平,这个近似值不能从一般的二阶泰勒近似值推导出来,所以我发现它表现不佳并不奇怪。(它需要这不是一个有效的峰度值。)因此,我希望第二个近似值比第一个近似值执行得更好,除非可能在基础分布的峰态高度平坦的情况下。κ=0