什么是统计学中的统计学?

机器算法验证 自习 样本量 推理 定义
2022-04-10 15:48:28

我很难理解统计数据的定义。

wikipedia,我了解到统计数据是任何给定人口的任何样本的任何“信息”(例如,范围、平均值、方差)。

而在我的大学里,统计的定义如下:

认为(X1,X2,...,Xi,...,Xn)是一个大小的随机样本n来自任何给定的 PDF 或 PMF。一个函数T=t(X1,X2,...,Xi,...,Xn)没有未知参数称为统计量。

我无法理解我的大学给出的定义。这两个定义是否相互关联?找到统计数据的需要是什么?

2个回答

统计数据是数据的函数。

就是这样。在不同的上下文中,您可能对不同的统计数据感兴趣。也许 T = 观察次数。这是一个有效的统计数据。或 T = 观察到的最大值。T = 第七次观察。T = 第六大观测值。我想说 T=1 也是有效的,只是一个常数,尽管它毫无意义。最常见的介绍是,我们查看 T = 样本均值,并使用它来推断总体参数。

也许您的样本不是事件实数!例如,也许您的 X1、X2、... 是学生的名字。一个有效的统计数据可以是 T= 最常见的名称。或 T = 每个名称中的字符总数。

重申一下,统计数据只是数据的函数。在介绍性课程中,您经常使用样本均值、样本方差,并使用一些代数来对总体参数做出数学陈述。

在课堂上提问从来都不是一个坏主意。统计量是基于样本对总体参数的估计。因此,如果 mu 是总体均值,则样本均值 x-bar 是统计量。