正态分布样本最大值的期望值

机器算法验证 正态分布 随机变量
2022-03-21 12:44:39

假设我有一个正态分布N(μ,σ2)我从中得出的n独立同居样本x1,,xn.

现在,让我们定义一个随机变量Y=max(x1,,xn).

什么时候n=1, 的期望值Yμ. 我希望作为n增加,期望值Y也应该增加。是否可以确定期望值Y对于任何值n, 按照μσ?

3个回答

首先请注意

Yn=max{X1,,Xn}=max{σϵ1+μ,,σϵn+μ}=σmax{ϵ1,,ϵn}+μ=σξn+μ
因此(μ,σ)也是最大值的位置尺度参数。渐近地,正态分布属于Gumbel分布的吸引力域,这意味着
2log(n)(ξndn)LG0
G0(x)=exp{exp(x)}Gumbel pdf 和
dn=2log(n)loglogn+log(4π)22log(n)

如果我们在这里结合两个答案(正态随机变量的近似顺序统计),我们有rthsmallest订单统计

E[r,n]μ+σ Φ1(rπ8nπ4+1)

对于我们想要的最大值r=n,所以我们有

E[Y]μ+σ Φ1(nπ8nπ4+1)

编辑:

我发现这篇论文在数学堆栈交换的一个线程中被引用(正常随机变量的近似顺序统计),所以我看了一下。对于最大值,r=n.

“在大小为 n 的样本中,第 r 大阶统计量的期望值由下式给出

E(r,n)=n!(r1)!(nr)!x{1Φ(x)}r1{Φ(x)}nrϕ(x)dx,

在哪里ϕ(x)=1/(2π)exp(12x2)Φ(x)=xϕ(z)dz."

  • Royston, JP (1982),“算法 AS 177:预期正常顺序统计(精确和近似)”,皇家统计学会杂志。系列 C(应用统计),31(2):161-165。

所以Y是一个订单统计量让我们标记它的密度函数g(n)(x), 表示它是第 n 个位置的变量的 pdf(即样本中最大值的 pdf)。让我们也标记正常N(μ,σ2)密度函数为f(x). 这是一个标准的结果

g(n)(x)=n[F(x)]n1f(x),
在哪里F(x)是的累积密度函数N(μ,σ2)(作为参考,我建议Wackerly、Mendenhall 和 Scheaffer 撰写的Mathematical Statistics (第 7 版),第 333 页)。

正是在这一点上,我无法继续 - 我不知道如何评估Y,因为它有这么奇怪的pdf。但是,我建议您搜索“订单统计的预期值” - 特别是,我在数学堆栈交换网站上找到了有关此主题的线程:

编辑:正如 Khol 所指出的,线程是用于均匀分布,而不是正态分布。制服显然更容易处理。为部分答案道歉!

https://math.stackexchange.com/questions/751229/order-statistics-finding-the-expectation-and-variance-of-the-maximum?utm_medium=organic&utm_source=google_rich_qa&utm_campaign=google_rich_qa