为什么 rand()^2 的分布与 rand()*rand() 的分布不同?

机器算法验证 期望值 随机生成 均匀分布
2022-02-09 07:39:31

在 Libre Office Calc 中,该rand()函数可用,它从均匀分布中选择 0 到 1 之间的随机值。我对我的概率有点生疏,所以当我看到以下行为时,我很困惑:

A= 200x1 列rand()^2

B= 200x1 列rand()*rand()

mean(A)=1/3

mean(B)=1/4

为什么是mean(A)!= 1/4

2个回答

考虑矩形可能会有所帮助。想象一下,您有机会免费获得土地。土地的大小将由(a)随机变量的一种实现或(b)同一随机变量的两种实现来确定。在第一种情况 (a) 中,该区域将是一个边长等于采样值的正方形。在第二种情况 (b) 中,两个采样值将表示矩形的宽度和长度。您选择哪种替代方案?

为正随机变量的实现。U

a) 一种实现的期望值确定正方形的面积,等于平均而言,该区域的大小将为 UU2

E[U2]

b) 如果有两个独立的实现,则面积将为平均而言,大小等于 因为两个实现都来自相同的分布并且独立。U1U2U1U2

E[U1U2]=E2[U]

当我们计算区域 a) 和 b) 的大小之差时,我们得到

E[U2]E2[U]

上述术语等同于本质上大于或等于Var[U]0

这适用于一般情况。

在您的示例中,您从均匀分布中采样。因此,U(0,1)

E[U]=12
E2[U]=14
Var[U]=112

我们得到 E[U2]=Var[U]+E2[U]

E[U2]=112+14=13

这些值是通过分析得出的,但它们与您使用随机数生成器获得的值相匹配。

并不是说 Sven 的出色回答缺少任何东西,但我想就这个问题提出一个相对基本的看法。

考虑绘制每个产品的两个分量,以便查看联合分布非常不同。

u1 vs u2 和 u1 vs u1 图

请注意,只有当两个分量都很大时,乘积才会很大(接近 1),当两个分量完全相关而不是独立时,这种情况更容易发生。

因此,例如,对于 (对于小 ) 的概率约为,但对于 ('B')版本大约是1ϵϵϵ/2U2U1×U2ϵ2/2

差别很大!

在上述图表上绘制等积等值线可能会有所帮助 - 即,对于 0.5、0.6、0.7、0.8、0.9 等值,xy=常数的曲线。随着您的值越来越大,对于独立情况,轮廓上方和右侧的点比例下降得更快。