统计中的大多数渐近结果证明,当时,估计量(例如 MLE)基于似然函数的二阶泰勒展开收敛到正态分布。我相信贝叶斯文献中也有类似的结果,即“贝叶斯中心极限定理”,它表明后验渐近收敛到正常的
我的问题是 - 基于泰勒级数的第三项,分布是否收敛到“在”它变得正常之前?或者这通常是不可能的?
统计中的大多数渐近结果证明,当时,估计量(例如 MLE)基于似然函数的二阶泰勒展开收敛到正态分布。我相信贝叶斯文献中也有类似的结果,即“贝叶斯中心极限定理”,它表明后验渐近收敛到正常的
我的问题是 - 基于泰勒级数的第三项,分布是否收敛到“在”它变得正常之前?或者这通常是不可能的?
您正在寻找御剑系列不是吗?
http://en.wikipedia.org/wiki/Edgeworth_series#Edgeworth_series
(注意御剑死于1926年,应该是最有名的统计学家吧?)
一个序列不可能“收敛”到一件事然后再到另一件事。渐近展开式中的高阶项将归零。他们告诉你的是,对于任何给定的值,它们有多接近于零。
对于中心极限定理(例如),适当的扩展是特征函数的对数:累积量生成函数(cgf)。分布的标准化固定了 cgf 的第零、第一和第二项。其余项,其系数是累积量,依序依赖于。随机变量的总和除以与成正比的东西——没有它就不会发生收敛)导致累积量——毕竟取决于矩——除以, 但同时因为我们对项求和,最终结果是阶项与。因此,标准化和的第三个累积量与成正比,第四个累积量与成正比,依此类推。这些是高阶项。(详情请参见Yuval Filmus的这篇论文。)
通常,的高负功率远小于低负功率。我们总是可以通过取足够大的值来确保这一点。因此,对于非常大的的所有负幂:它们收敛到零。在收敛的过程中,通过附加项越来越准确地测量对最终极限的偏离项是初始“修正”或偏离极限值;下一个项是一个更小、更快速消失的修正,以此类推。简而言之,附加项让您了解序列收敛到极限的速度。
这些附加项可以帮助我们的有限(通常很小)值进行更正。它们一直在这方面出现,例如Chen 对 t-test 的修改,它利用了三阶 ( ) 项。
这是试图回答您有见地的问题的尝试。我已经看到包含泰勒级数的第三项以提高级数收敛到真实分布的速度。但是,我还没有看到(以我有限的经验)使用第三和更高的时刻。
正如 John D. Cook 在他的博客(这里和这里)中指出的那样,除了Berry-Esseen 定理之外,在这个方向上没有做太多的工作。我的猜测是(根据博客中关于近似误差受限制的观察),因为 mle 的渐近正态性以 (,作为样本大小),考虑到更高的矩不会改善正态性结果。
因此,我想,您的问题的答案应该是no。渐近分布收敛到一个正态分布。(根据 CLT,在 Lindberg 的 CLT 的正则条件下)。然而,使用高阶项可能会提高收敛到渐近分布的速度。
绝对不是我的领域,但我很确定存在三阶和更高阶的渐近线。这有什么帮助吗?
罗伯特·L·斯特劳德曼。高阶渐近近似:拉普拉斯、鞍点和相关方法 美国统计协会杂志卷。95, No. 452(2000 年 12 月),第 1358-1364 页