为什么均匀分布(0 到 1 之间)的自然对数的平均值与 0.5 的自然对数不同?

机器算法验证 意思是 期望值 均匀分布 不可缺少的 转换
2022-02-11 00:32:02

对于使用生成的 0 和 1 之间的均匀分布变量

rand(1,10000)

这将返回 0 到 1 之间的 10,000 个随机数。如果取平均值,则为 0.5,而如果取该样本的对数,则取结果的平均值:

mean(log(rand(1,10000)))

我希望结果是,但答案是 -1。为什么会这样? log0.5=.6931

4个回答

这是Jensen 不等式的另一个例证

E[logX]<logE[X]
(因为函数xlog(x)是严格凹的] 并且具有更一般的(反)性质,即当变换不是线性的(加上一些奇异的情况)时,变换的期望不是期望的变换。(然而,我的大多数本科生都坚信神奇的身份E[h(X)]=h(E[X])如果我只从他们的期末试卷中出现这种平等的频率来判断的话。)

考虑对称放置在周围的两个值,例如他们的日志不是对称的更远。因此,当您平均它们时,您会得到小于的东西。0.50.40.60.250.75log(0.5)log(0.5ϵ)log(0.5)log(0.5+ϵ)log(0.5)

类似地,如果你在这些对称放置的值对的集合周围采取一个很小的间隔,你仍然会得到每对日志的平均值低于 ...并且从那个观察中转移是一件简单的事情对日志的期望的定义。log(0.5)

实际上,通常,除非是线性的E(t(X))t(E(X))t

值得注意的是,如果XUniform(0,1), 然后logXExponential(λ=1), 以便E[logX]=1. 明确地说,

fX(x)=1(0<x<1)={1,0<x<10,otherwise
暗示
Y=g(X)=logX
有密度
fY(y)=fX(g1(y))|dg1dy|=1(0<ey<1)|ey|=ey1(0<y<)={ey,y>00,otherwise.
因此YExponential(λ=1)它的意思是1. 这提供了一种非常方便的方法来生成指数分布的随机变量,通过对上的均匀随机变量进行对数变换(0,1).

请注意,转换后的统一变量的平均值只是在域上进行转换的函数的平均值(因为我们期望每个值都被平等地选择)。这很简单,

1baabt(x)dx=01t(x)dx

例如(在 R 中):

01log(x)dx=(1log(1)1)0=01=1

mean(log(runif(1e6)))
[1] -1.000016
integrate(function(x) log(x), 0, 1)
-1 with absolute error < 1.1e-15

01x2dx=13(1303)=13

mean(runif(1e6)^2)
[1] 0.3334427
integrate(function(x) (x)^2, 0, 1)
0.3333333 with absolute error < 3.7e-15

01exdx=e1e0=e1

mean(exp(runif(1e6)))
[1] 1.718425
integrate(function(x) exp(x), 0, 1)
1.718282 with absolute error < 1.9e-14
exp(1)-1
[1] 1.718282