在我学习统计学的时候,这两个表达式让我很困惑。在我看来,它们是完全不同的东西。
随机样本是从总体中随机抽取一个样本,而随机变量就像一个函数,它将实验的所有可能结果的集合映射到一个实数。
但是,假设我画了一些样本,,和,其中和是未知的,是,,随机样本还是随机变量?
在我学习统计学的时候,这两个表达式让我很困惑。在我看来,它们是完全不同的东西。
随机样本是从总体中随机抽取一个样本,而随机变量就像一个函数,它将实验的所有可能结果的集合映射到一个实数。
但是,假设我画了一些样本,,和,其中和是未知的,是,,随机样本还是随机变量?
随机变量X :是从样本空间到实线的函数。这是一个确定性公式,可以像在掷骰子的随机实验中记下骰子落在的数字一样简单。实验是随机的,我们无法控制许多决定其结果的物理因素;然而,一旦骰子落地,随机变量就会将物理世界中的结果映射到一个数字。
其他示例包括测量 8 个年级学生样本的身高,或许可以推断总体参数(包括均值和方差)。每个男孩或女孩都是随机实验的结果,就像扔硬币一样。一旦选择了一个主题,实际映射到以英寸或厘米为单位的数字就不会受到随机性的影响,尽管它的名称是“随机变量”。
一组这样的实验将构成一个样本:“在统计学中,简单的随机样本是从更大的集合(总体)中选择的个体(样本)的子集。” 这个定义很直观,但隐含了人口这一术语。本文试图弥补这一差距,指出“人口”一词作为名词应该指的是样本空间,而不是像许多教科书那样的随机变量。”
随机样本是独立同分布 (iid) 随机变量其中是应用于第个实验结果的函数尽管无放回抽样不满足独立性要求,但在从大量人口中抽样时忽略了这一点,以利于计算方便。
元组 x_1是随机变量的特定实现,在问题中提出的情况下,将从相同分布随机变量中得出. 因此,在 OP 中,“抽取一些样本”的过程将导致这个随机变量集合的单独实现。
随机变量是数学定律的对象,例如 LLN 或 CLT。随机变量的分布将决定从随机样本中进行归纳的可行性。例如,任何给定的实现将始终具有作为元组或实数的平均值和标准差,但它们生成的随机变量可能没有有限矩,例如帕累托,这会损害关于总体特征的统计推断。
在 OP 的示例中,每个随机样本都是对相同随机变量的观察。所以随机样本是对随机变量的观察。随机变量是将样本空间映射到实数的函数。