“统计推断”的直观解释

机器算法验证 机器学习 推理 直觉
2022-01-22 21:07:44

向某人解释推理概念的最简洁、最简单的方法是什么?直观上是什么意思?

您将如何向外行或学习过非常基本的概率和统计课程的人解释它?

有助于使其“直观”清晰的东西将不胜感激!

4个回答

有时最好通过一个具体的例子来解释一个概念:

想象一下,你抓起一个苹果,咬一口,它尝起来很甜。你会根据那一口得出整个苹果都很甜的结论吗?如果是,你会推断出整个苹果都是甜的,因为它咬了一口。

推理是使用部分来了解整体的过程。

在这个过程中如何选择部分很重要:部分需要代表整体。换句话说,这部分应该是整体的迷你版。如果不是这样,我们的学习就会有缺陷,甚至可能是不正确的。

为什么我们需要推理?因为我们需要根据部分提供的关于整体的部分信息做出结论,然后做出涉及整体的决策。

我假设您在这里询问统计推断

使用Larry A. Wasserman的All of Statistics中的定义:

统计推断,或计算机科学中所说的“学习”,是使用数据推断生成数据的分布的过程。一个典型的统计推断问题是:

Given a sample X1,,XnF, how do weinfer F?

在某些情况下,我们可能只想推断的某些特征,例如它的均值。F

在统计学中,我们将数据解释为随机变量的实现,所以我们在统计学中学习的是随机变量的特征,即分布、期望值、方差、协方差、分布参数等。所以统计推断意味着学习那些事情从数据

引用 ETJaynes,“概率论:科学的逻辑”(强烈推荐阅读):

通过“推理”,我们的意思很简单:只要手头有足够的信息允许演绎推理;归纳或似是而非的推理——在实际问题中几乎总是如此——必要的信息不可用。但是如果一个问题可以通过演绎推理来解决,那么它就不需要概率论了;因此我们的主题是不完整信息的优化处理。

用我自己的话来说,推理就是从一些给定的信息开始,并从中得出理性的结论,而理性通常由谓词逻辑概率论的规则来定义。

一个人用来得出结论的信息可能来自一个人对世界的信念(用技术术语来说:模型和先验分布),来自已观察到的数据,或两者兼而有之。当然,只有当它所依据的信息有效时,推理才能有效!

如果信息是确定的(你知道事情是真是假),那么推理是由谓词逻辑进行的:亚里士多德是人,人不是鸟,因此我们推断阿罗斯多德不是鸟。

如果信息是不确定的(你相信事情但不确定),那么推断是通过概率论进行的:如果 50% 的人喜欢披萨,50% 喜欢披萨的人也喜欢意大利面,而 75% 的人喜欢披萨。喜欢披萨的也不喜欢意大利面,你可以推断——没有任何进一步的信息——你有 37.5% 的机会喜欢意大利面。当您听到某种噪音时,根据您的经验,您可能不确定是电视还是您的小女儿是源头。您正在得出推论-可能是电视或您的女儿-但您不确定,因为提供的信息不确定。当人们谈论统计推断,它们通常指的是技术应用程序,其中人们想要使用大量数据来推断有关本身不可观察的事物的信息,就像在上一个示例中一样。*

一个典型的技术示例如下:我们在房间里有一个温度传感器,它返回电压传感器数据表提供了通过线性模型将测量电压与温度相关联的图表: 然后我们可以使用这个模型和电压测量来推断房间的温度。到目前为止,一切都是演绎的,因为我们假设所有信息都是确定的!给定,我们可以简单地计算V(k)

V(k)=aT(k)+b.
V(k)T(k)

然后我们观察到估计的温度波动非常快,比我们预期的室温波动要快得多。所以我们假设存在某种零均值、不相关的干扰也会影响传感器: 我们现在不确定每个电压测量的含义(使每个测量成为 iid RV)!这告诉我们,我们应该对几次电压测量值进行平均,以便更好地估计当前室温。** 如果我们使用的任何信息(传感器的电压-温度模型、干扰模型、实际电压测量值) ) 是错误的,那么我们的温度估计也将是错误的。

V(k)=aT(k)+b+ϵ(k).

*我们的大脑是一个极其复杂的推理设备,它一直在得出关于我们自己、其他人、我们的环境和我们的未来的各种结论[1] [2] [3]

**假设采样率远高于温度变化率并且噪声确实不相关。

统计推断是良好猜测的艺术--- 它需要从已知(观察到的)相关事物中猜测未知事物,并在您的猜测中给出置信度、可变性等的相关度量。