对于使用生成的 0 和 1 之间的均匀分布变量
rand(1,10000)
这将返回 0 到 1 之间的 10,000 个随机数。如果取平均值,则为 0.5,而如果取该样本的对数,则取结果的平均值:
mean(log(rand(1,10000)))
我希望结果是,但答案是 -1。为什么会这样?
对于使用生成的 0 和 1 之间的均匀分布变量
rand(1,10000)
这将返回 0 到 1 之间的 10,000 个随机数。如果取平均值,则为 0.5,而如果取该样本的对数,则取结果的平均值:
mean(log(rand(1,10000)))
我希望结果是,但答案是 -1。为什么会这样?
这是Jensen 不等式的另一个例证
考虑对称放置在周围的两个值,例如和或和。他们的日志不是对称的。比离更远。因此,当您平均它们时,您会得到小于的东西。
类似地,如果你在这些对称放置的值对的集合周围采取一个很小的间隔,你仍然会得到每对日志的平均值低于 ...并且从那个观察中转移是一件简单的事情对日志的期望的定义。
实际上,通常,除非是线性的
值得注意的是,如果, 然后, 以便. 明确地说,
请注意,转换后的统一变量的平均值只是在域上进行转换的函数的平均值(因为我们期望每个值都被平等地选择)。这很简单,
例如(在 R 中):
mean(log(runif(1e6)))
[1] -1.000016
integrate(function(x) log(x), 0, 1)
-1 with absolute error < 1.1e-15
mean(runif(1e6)^2)
[1] 0.3334427
integrate(function(x) (x)^2, 0, 1)
0.3333333 with absolute error < 3.7e-15
mean(exp(runif(1e6)))
[1] 1.718425
integrate(function(x) exp(x), 0, 1)
1.718282 with absolute error < 1.9e-14
exp(1)-1
[1] 1.718282