机器算法验证 - 描述性统计和推论性统计有什么区别？ - 吾爱随笔录

描述性统计和推论性统计有什么区别？

机器算法验证术语描述性统计推理

2022-02-15 06:09:53

我的理解是，描述性统计定量地描述了数据样本的特征，而推论统计量对抽取样本的人群进行了推断。

但是，统计推断的维基百科页面指出：

在大多数情况下，统计推断使用通过某种形式的随机抽样从感兴趣的人口中提取的数据来提出关于人口的命题。

“大部分”让我觉得我可能没有正确理解这些概念。有没有不提出关于人口命题的推论统计的例子？

4个回答

来自行为科学背景，我特别将这个术语与介绍性统计教科书联系起来。在这种情况下，区别在于：

描述性统计 是样本数据的函数，它们在描述数据的某些特征方面具有内在意义。经典的描述性统计包括均值、最小值、最大值、标准差、中值、偏斜、峰度。
推论统计是样本数据的函数，可帮助您就总体参数的假设进行推断。经典的推论统计包括 z、t、 $\chi^2$ , F 比等。

重要的一点是，任何统计数据，无论是推论性的还是描述性的，都是样本数据的函数。参数是总体的函数，其中术语总体与表示基础数据生成过程相同。

从这个角度来看，数据的给定函数作为描述性或推断性统计的状态取决于您使用它的目的。

也就是说，一些统计数据在描述数据的相关特征方面显然更有用，有些统计数据非常适合辅助推理。

推论统计： 标准检验统计量，如 t 和 z，对于给定的数据生成过程，其中零假设为假，预期值受样本大小的强烈影响。大多数研究人员不会将此类统计数据视为估计具有内在兴趣的人口参数。
描述性统计：相比之下，描述性统计确实估计了通常具有内在兴趣的总体参数。例如，样本均值和标准差提供了等效总体参数的估计值。甚至像最小值和最大值这样的描述性统计数据也提供了关于等效或相似人口参数的信息，尽管在这种情况下，当然需要更加小心。此外，许多描述性统计数据可能存在偏差或不符合理想估计量。但是，它们在估计感兴趣的总体参数方面仍然有一些效用。

因此，从这个角度来看，需要了解的重要事项是：

统计：样本数据的函数
参数：人口的功能（数据生成过程）
估计器：用于提供参数估计的样本数据的函数
推理：对参数得出结论的过程

因此，您可以根据研究人员使用统计数据的意图来定义描述性和推理性之间的区别，也可以根据其通常使用方式来定义统计数据。

一种形式的推断是基于实验治疗的随机分配，而不是基于人群的随机抽样（即使是假设的）。奥斯卡·肯普索恩（ Oscar Kempthorne）是支持者。

Edgington (1995) 中的第一个例子，随机化测试很好地说明了这种方法。研究人员获得十个受试者，将他们随机分成两组，分配治疗 $A$ 一组 & $B$ 另一方面，测量他们的反应并计算学生的 t 统计量，以了解组均值的差异。他计算的不是使用正态抽样理论来评估显着性 $t$ 对于可能分配治疗的每一种可能方式（其中有 252 种）；然后，注意到每个排列在没有治疗效果的原假设下的可能性相同，他看到九给出了更高的值 $t$ 比观察到的 & 计算 p 值 $10/252=0.04$ . 通常，这里的“获得”可能意味着任何东西——也许在他的讲座中举手的前十名本科生被选中了——但是通过这种分析，没有必要保持假装科目是随机抽样的感兴趣的人群（缺点是任何超出这十个的概括都是统计外的）。

预测是另一个领域，你不一定要制定关于人口的命题。（我不知道每个人都想将预测称为“推理”，但有 Geisser (1993)，Predictive Inference: An Introduction）。通常预测来自拟合的人口模型，但并非总是如此；例如@Matt 的分类示例，模型平均（贝叶斯或基于 Akaike 权重），或指数平滑等预测算法。

注意我认为“推论统计与描述统计”更多地是指统计学科，而不是从样本计算的数量。推论统计和描述统计之间没有本质区别；正如@Jeremy 指出的那样，这取决于您将其用于什么用途。

我不确定分类是否一定会说明从中提取数据点的人群。您可能知道，分类使用由一些“特征”向量组成的训练数据，每个向量都标记有特定的类，以预测属于其他未标记特征向量的类标签。例如，我们可能会使用患者的生命体征和医生的诊断来预测其他患者是健康还是生病。

一些分类器，称为“生成分类器”，试图明确地对产生每个类的群体或数据生成过程进行建模。例如，朴素贝叶斯算法计算 $P(\textrm{class}=c|\textrm{features})$ 每个班级 $c$ ，假设特征都是独立的。这些模型可以合理地被视为关于人口的陈述。

然而，其他分类器在没有对类本身建模的情况下寻找类之间的差异；这些被称为判别分类器。一个典型的例子是最近邻分类器，它将一个未标记的例子分配给它的最近邻的类（其中 close 以某种合理的方式定义问题）。这似乎没有包含太多（如果有的话）关于从中提取数据点的人群的信息。

如果您对描述性统计和推断性统计之间的差异感兴趣，那么考虑分析的目的可能会更有成效。一个描述性的统计数据，比如平均值，可能会告诉你一个典型的湖中有多少鳟鱼——它们描述了一些东西。推理统计量，如 $t$ - 测试，可能会告诉您这些湖泊中的鳟鱼是否通常比鲈鱼多 - 它可以让您对描述性统计数据做出声明。

在一行中，给定数据，描述性统计试图以最小的信息损失总结数据的内容（取决于您使用的度量）。您可以查看数据的地理分布。（例如，查看班级的表现图并说出谁在顶部，底部等等）

在一行中，给定数据，您尝试估计和推断数据来自的假设总体的属性。（例如，通过班级中的优秀样本来了解 7 年级学生，假设基础人口足够大，以至于您无法将他们全部考虑在内）

其它你可能感兴趣的问题

上一篇朱莉娅：评估它的表现下一篇如何解释 GLM 中的截距项？