了解测量浓度不等式

机器算法验证 可能性 概率不等式
2022-03-28 10:09:51

本着这个问题的精神,理解 Hoeffding 不等式中使用的引理证明,我试图理解导致 Hoeffding 不等式的步骤。

在证明中对我来说最神秘的是计算 iid 变量总和的指数矩的部分,然后应用马尔可夫不等式。

我的目标是理解:为什么这种技术会给出严格的不等式,它是我们能达到的最严格的吗?一个典型的解释是指指数的矩生成特性。然而,我觉得这太模糊了。

Tao 的博客http://terrytao.wordpress.com/2010/01/03/254a-notes-1-concentration-of-measure/#hoeff中的一篇文章可能会有一些答案。

考虑到这个目标,我的问题是关于 Tao 的帖子中的三点,我一直坚持,我希望一旦解释就可以提供见解。

  1. Tao 使用第 k 个矩导出以下不等式

    P(|Sn|λn)2(ek/2λ)k.     (7)
    如果这对于任何 k 都是正确的,那么他得出一个指数界。这就是我迷路的地方。
    P(|Sn|λn)Cexp(cλ2)     (8)

  2. 提出了 Hoeffding 引理: Lemma 1 (Hoeffding's lemma) 让X是在区间内取值的标量变量[a,b]. 那么对于任何t>0,

    EetXetEX(1+O(t2Var(X)exp(O(t(ba)))).     (9)
    尤其
    EetXetEXexp(O(t2(ba)2)).     (10)
    引理 1 的证明始于对泰勒展开的期望etX=1+tX+O(t2X2exp(O(t))) .为什么展开可以由那个二次项限制?等式 10 是如何得出的?

  3. 最后给出一个练习:
    练习 1 证明O(t2(ba)2)(10)中的因子可以替换为t2(ba)2/8,这很锋利。这将提供比理解 Hoeffding 不等式中使用的引理的证明更短的证明,但我不知道如何解决这个问题。

关于不等式的证明或我们无法得出更严格界限的原因的任何进一步的直觉\解释绝对是受欢迎的。

1个回答

指数矩的使用是证明测度不等式集中的过程中的一个常见步骤。我的理解如下 1)通过使用EeX而不是EX,一个捕捉所有的时刻X,而不仅仅是第一刻。因此,约束总是有利的EeX, 而不是绑定EX, 因为有更多信息EeX. 为什么EeX有更多信息?一个非正式的解释是由一个泰勒展开的事实给出的eX=1+X+X22+X36+. 如您所见,X参与其中。因此,当你采取EX,你基本上最终会限制所有时刻X.