随机变量与统计?

机器算法验证 随机变量 定义
2022-03-08 13:57:08

随机变量和统计量有什么区别?

在形式上,随机变量似乎只是任何实值函数(它的域是我们称之为“样本空间”的集合)。

但是统计数据不也完全一样吗?也就是说,统计量不也只是任何实值函数(其域是称为“样本空间”的集合)吗?


例子。我们掷骰子。样本空间为Ω={1,2,3,4,5,6}.

T是骰子价值的两倍:正式地,T:ΩR是由定义的函数T(x)=2x.

T一个随机变量,一个统计量,或两者兼而有之?


在您的回答中,请给出:

  1. 随机变量的精确定义
  2. 统计量的精确定义
  3. 我的示例中问题的答案:“是T一个随机变量、一个统计量,还是两者兼而有之?”
3个回答

统计量是在一个或多个随机变量上定义的函数。

所以是的,统计数据一个随机变量,并且遵循分布。

另一个答案给出了一堆独立同分布正态随机变量的平均值的例子。 X1,...,XnN(μ,σ2)

平均值一个统计量,因为它是一个定义在随机变量上的函数

X¯=g(X1,X2...Xn)=1ni=1nXi

然而,有一个条件,那就是统计不能明确地依赖于未知参数。取以下定义g

g(X1)=X1μσ

尽管g这是一个随机变量的函数,它遵循标准正态分布,它不是统计量(除非μσ是已知的)。

更详细的解释见 pg. 122

随机变量的定义取决于上下文,因为您需要定义的精确程度取决于您正在做的数学类型。在最简单的定义中,随机变量 X:ΩR是一组可能结果的函数Ω到实数上R. 例如,在硬币的情况下,Ω={H,T}, 你可能有H=1T=0. 概率分布包含有关概率的所有信息。

统计量是从样本中计算出来的量在统计理论中,通常这些样本本身就是随机变量。所以统计数据本身是一个随机变量。例如,如果

X1,...,XnN(μ,σ2)
那么样本均值也是一个随机变量
X¯=1ni=1nXi
X¯N(μ,σ2n)

然而,在实践中,人们可能会有所不同,他们是否认为统计数据是指随机变量。

关键是统计数据不是未知参数的函数。所以并不是所有的随机变量都是统计数据。请参阅不独立于样本分布的统计数据示例?. 请注意,统计量的分布可能取决于未知参数;参看。枢轴,一个随机变量,其分布不依赖于未知参数,尽管它可能是未知参数的函数。

某事物是统计数据并不意味着您必须称其为统计数据:在应用程序中,该术语往往保留用于在推理或描述中发挥特殊作用的随机变量,并且通常会降低样本空间的维数。你的T是一个随机变量;& 也是一个统计数据,尽管使用后一个术语的动机并不明显。