“归一化”高斯随机变量的分布

机器算法验证 分布 正态分布 正态假设
2022-04-03 07:08:14

是独立的正态分布随机变量。什么是分布: 其中是样本的标准差? 我在模拟中遇到了这个问题,其中模拟的随机变量在使用之前被“标准化”,但没有提供统计分析。X1,,Xn

Yi=XistdDev(X1,,Xn),
stdDev(X1,,Xn)

1个回答

不打算作为答案......但更多的评论对于评论框来说太长了......

更新了 OP 将样本方差更改为样本标准差

为了了解问题的难度......考虑这个问题可以采取的最简单的形式,即:

  • 的样本,其中 ...n=2
  • X1 是从普通标准 Normal 父级随机抽取的。X2

然后,使用版本的样本方差,并将样本标准差定义为后者的平方根,... 问题是找到以下的分布:(n1)

Y=2X1|X1X2|where XiN(0,1)

这似乎并不容易......别介意解决一般n2

pdf 的蒙特卡罗模拟(对于不同的样本大小n

一般的解决方案会是什么样子?的样本的经验蒙特卡罗 pdf 每个图比较:nYn=2,3,525

  • 经验蒙特卡罗 pdf [波浪蓝色曲线] 到
  • 标准正态 pdf(红色虚线曲线)

在此处输入图像描述

也许有一些安慰,到时间时,分布似乎与标准正态分布非常接近(前提是父对象是标准正态分布)。但是小样本量很棘手。n=25

  • 如果您对一般的正态分布(非零均值)感兴趣,那么当然还有图不对称的额外复杂性。