我很好奇,因为大多数基本的本科统计参考只是通过提到抽样分布和均值的抽样分布来开始推论统计。我的问题是每个统计数据都有一个吗?甚至样本比例、样本方差和标准差?
编辑:他们会是什么样子?
我很好奇,因为大多数基本的本科统计参考只是通过提到抽样分布和均值的抽样分布来开始推论统计。我的问题是每个统计数据都有一个吗?甚至样本比例、样本方差和标准差?
编辑:他们会是什么样子?
是的,每个统计数据都有一个抽样分布(尽管有些可能是退化的)。
他们会是什么样子?
统计数据的抽样分布 - 就像平均值一样 - 通常取决于您开始时的总体分布(当然还有样本量)。
例如,在来自正态分布的随机样本中,样本方差是卡方随机变量的倍数,因此样本 sd 是chi随机变量的倍数。
下面是来自正态分布的 10000 个大小为 10 的样本的样本标准偏差的直方图,以及真实的样本分布(比例尺,红色曲线):
(点击查看大图)
如果您不从正常总体开始,则样本 sd 的分布是另一回事。例如,这是来自均匀分布的 10000 个大小为 10 的样本的样本 sd:
正如我们所看到的,这个是轻微的左偏而不是轻微的右偏(我没有计算它的理论分布)。
另请注意,样本比例是平均值的一种形式(用 1 标记类别内观察值,用 0 标记类别外观察值,样本平均值是您开始使用的样本比例)。如果在组中的概率是恒定的并且观察是独立的,那么它将具有离散的抽样分布;一个缩放的二项式。
许多统计数据在相当温和的条件下是渐近正态的,但许多不是(例如,考虑一个样本最大值)。
各种统计数据的抽样分布出现在许多情况下。例如,抽样分布在假设检验中很重要。
是的,因为每个统计数据都是您样本的函数(它们是随机变量),它们将具有分布。推断分布可能不像使用样本均值那么容易。