我有一个关于概念的问题:
这些常见的概率论和数理统计概念有什么实际意义。这些概念通常相互结合。到处都是枯燥的公式和冷酷的正式定义,这无助于理解物理意义/意义是什么以及如何将其应用于现实世界的代表性示例,而不是教科书和网站中给出的一组类似问题。
通常,会给出这样的冷公式:“随机变量与其均值的平方偏差的期望值”、“一组数据值的变化量或离散量”,并附有公式。
谁能解释这些概念在现实世界中的实际含义是什么?
我有一个关于概念的问题:
这些常见的概率论和数理统计概念有什么实际意义。这些概念通常相互结合。到处都是枯燥的公式和冷酷的正式定义,这无助于理解物理意义/意义是什么以及如何将其应用于现实世界的代表性示例,而不是教科书和网站中给出的一组类似问题。
通常,会给出这样的冷公式:“随机变量与其均值的平方偏差的期望值”、“一组数据值的变化量或离散量”,并附有公式。
谁能解释这些概念在现实世界中的实际含义是什么?
我将使用陈词滥调的例子——抛硬币。请注意,我在此示例中放弃了严谨性和一些重要假设,但这很好。
假设我有一枚普通硬币——也就是说,一旦我翻转它,它有 50% 的机会正面朝上,50% 的机会朝反面朝上。
因此,如果我将其翻转 10 次,我预计会出现 5 个反面和 5 个正面。但我很可能得到 6 个正面和 4 个反面。或 7 头和 3 尾。
但是等一下 - 为什么我会期待 5 个反面和 5 个正面?也许这很明显——因为每次翻转都有 50% 的机会正面朝上——所以. 换句话说,我抛硬币练习的预期值是 5 个正面(因此是 5 个反面)。
现在让我们让这个例子更有趣。让我们掷硬币 100 次。但是检查一下 - 我的预期值没有任何变化。我仍然预计一半的投掷是正面 - 即 50 个正面。
但实际上我可能不会得到 50 个正面。假设我有45个头。这与我的预期值 50 相差甚远吗?我应该对这个结果感到惊讶吗?你会吗?可能不是。如果我告诉你我只有 20 个正面,那么你可能会认为有问题。你认为这是为什么?
这是一种直观的方差概念。我们的结果偏离预期值的可能性有多大?有些事情(比如抛硬币)很有可能偏离其预期值。其他的没有。
我们可以在这上面加上一个数字。在某些情况下,为了数学上的方便和可解释性,我们可以取这个数字的平方根。这就是标准差。
您在上面提到的定义在技术上更准确,并且具有直接的数学公式,因此诸如概率加权和随机变量之类的术语。
但是如果你理解了抛硬币的例子,那么你就会理解这些术语的精神。
随机变量是一个量,其值在测量时看起来是随机的。正如@ilan man 所描述的,在掷硬币实验中观察正面或反面就是一个简单的例子。您还可以将随机变量定义为最后十次投掷硬币的平均值(例如,将 H 映射到 1 并将 T 映射到 0)。你每天上班的时间也是一个随机变量。你每天早上的体重是一个随机变量。等等。
我们通过它们的分布来表征随机变量,从广义上讲,它描述了特定值被观察到的可能性。随机变量的期望值是该分布中心的量度,而方差是其分布的量度。(标准偏差是方差的平方根,这是一个很好的衡量标准,因为它与变量具有相同的单位 - 粗略地说,它衡量的是分布的“宽度”。)
请注意,这两个度量都是“非稳健的”,这意味着它们对异常值很敏感。“中心”和“宽度”也有“稳健”的统计数据。中位数是指点数越来越多的值,它是质心的稳健度量。由于它仅取决于较大或较小值的计数,因此远离中位数的细节不会对中位数产生影响。有许多稳健的宽度度量,但与中位数最相似的是“中位数绝对增量”,即
可能对某人来说,了解期望值如何会有所帮助, 方差和标准差与随机变量的正态分布相关。
在公式中:
在图表上:
对于正态分布,离均值小于一个标准差的值占集合的68.27%;而平均值的两个标准差占95.45%;三个标准差占99.73%。 来源:正态分布
![]()
![]()
以及带有随机变量的真实示例。NBA球员的身高均服从正态分布: