iid 随机变量的期望值

机器算法验证 随机变量 期望值 意思是 独立同居
2022-03-14 18:22:50

我遇到了这个我不明白的推导:如果X1,X2,...,Xn是从均值群体中抽取的大小为 n 的随机样本μ和方差σ2, 然后

X¯=(X1+X2+...+Xn)/n

E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))

E(X¯)=(1/n)(μ+μ+...n times)=μ

这就是我迷路的地方。使用的论据是E(Xi)=μ因为它们分布相同。实际上这不是真的。假设我有一个样本,S={1,2,3,4,5,6}然后如果随机选择 2 个替换数字并重复此过程 10 次,则我得到 10 个样本: (5, 4) (2, 5) (1, 2) (4, 1) (4, 6) (2, 4) (6, 1) (2, 4) (3, 1) (5, 1)。这就是 2 个随机变量的样子X1,X2. 现在,如果我取期望值X1我明白了,

E(X1)=1.(1/10)+2.(3/10)+3.(1/10)+4.(2/10)+5.(2/10)+6.(1/10)=34/10=3.4

但总体的期望值为 3.5。我的推理实际上有什么问题?

1个回答

首先,X1,X2,...,Xn不是样本。正如 Tim 所指出的,这些是随机变量。假设你正在做一个实验,你估计食物中的水量;为此,您可以对 100 种不同的食品进行 100 次含水量测量。每次你得到一个含水量值。这里的含水量是随机变量,现在假设世界上总共有 1000 种食物。100 种不同的食品将被称为这 1000 种食品的样本。请注意,含水量是随机变量,获得的 100 个含水量值作为样本。

假设你从一个概率分布中随机抽取 n 个值,独立且相同,假设E(X)=μ. 现在你需要找出期望值X¯. 由于每个Xi是独立和相同采样的,每个的期望值Xiμ. 因此你得到nμn=μ.

您问题中的第三个等式是估计器成为总体参数的无偏估计器的条件。估计量无偏的条件是

E(θ¯)=θ

其中 theta 是总体参数,并且θ¯是样本估计的参数。

在您的示例中,您的人口是{1,2,3,4,5,6}你得到了一个样本10iid 值是{5,2,1,4,4,2,6,2,3,5}. 问题是你将如何估计这个样本的总体平均值。根据上述公式,样本的平均值是总体均值的无偏估计。无偏估计量不必等于实际均值,但在给定此信息的情况下,它尽可能接近均值。