概率分布的“矩”有什么“矩”?

机器算法验证 分布 术语 时刻 直觉
2022-02-05 00:37:52

我知道什么是矩以及如何计算它们以及如何使用矩生成函数来获得更高阶的矩。是的,我知道数学。

既然我需要在工作中润滑我的统计知识,我想我不妨问这个问题——这已经困扰我大约几年了,回到大学时,没有教授知道答案,或者只是驳回这个问题(老实说) .

那么在这种情况下,“时刻”这个词是什么意思呢?为什么选择这个词?这对我来说听起来并不直观(或者我在大学里从来没有这样听过:)想想看,我同样对它在“惯性矩”中的用法感到好奇;)但现在我们不要专注于此。

那么分布的“时刻”是什么意思,它试图做什么以及为什么这个词!:) 为什么有人关心时刻?在这一刻,我对那一刻的感觉不一样;)

PS:是的,我可能已经问过一个类似的关于方差的问题,但我确实重视直观理解而不是“看书找出答案”:)

4个回答

根据 HA David 的论文“数学统计中常用术语的第一次(?)出现”,在这种情况下第一次使用“矩”这个词是在 1893 年卡尔·皮尔森(Karl Pearson)写给自然的一封题为“不对称频率曲线”的信中。

Neyman 1938 年的Biometrika论文“关于 Karl Pearson 对二项式矩的推导的历史注释”对这封信和 Pearson 随后关于二项式分布矩和矩方法的工作进行了很好的概要。这真是一本好书。希望您可以访问 JSTOR,因为我现在没有时间对论文进行很好的总结(尽管我会在这个周末)。虽然我会提到一篇文章,它可能会解释为什么使用“时刻”这个词。来自内曼的论文:

它 [Pearson 的回忆录] 主要涉及通过一些涉及简单公式计算的过程来逼近连续频率曲线的方法。考虑的这些公式之一是“点二项式”或“加载纵坐标的二项式”。这个公式
不同于今天我们所说的二项式,即。(4) 仅乘以因子$\alpha$,表示希望拟合的连续曲线下的面积。

这就是最终导致“瞬间方法”的原因。Neyman 在上述论文中回顾了 Pearson 对二项矩的推导。

从皮尔逊的信中:

我们现在将继续寻找围绕 GN 的矩形系统的前四个矩。如果每个矩形的惯性可以被认为是集中在它的中间垂直,我们应该有 $s^{\text{th}}$ 矩圆形 NG,写作 $d = c(1 + nq)$。

这暗示了皮尔逊使用“矩”一词来暗指“惯性矩”,这是物理学中常见的一个术语。

以下是 Pearson 的Nature信件大部分内容的扫描图:

在此处输入图像描述

在此处输入图像描述

您可以在此处查看第 615 页上的整篇文章

每个人都有自己的时刻。我有我的Cumulant 和超越方差、偏度和峰度的时刻名称,并花了一些时间阅读这个华丽的线程。

奇怪的是,我没有在“HA David”的论文中找到“时刻提及”。所以我去了 卡尔·皮尔森:统计时代的科学生活, TM Porter 的书。和卡尔·皮尔森和现代统计学的起源:一个弹性学家成为 统计学家. 例如 他 编辑了 弹性 理论 和 从 伽利略 到 现在 的 材料 强度 的 历史.

他的背景非常广泛,尤其是工程和弹性学教授,参与确定桥梁跨度的弯矩和计算砌体大坝的应力。在弹性方面,人们只能以有限的方式观察正在发生的事情(破裂)。他似乎对(来自波特的书中)感兴趣:

图形计算,或者以其最庄严和数学的形式,图形静态。

之后 :

从他的统计生涯开始,甚至在此之前,他就使用“矩量法”拟合曲线。在力学中,这意味着将一个复杂的物体与一个简单或抽象的物体相匹配,这些物体具有相同的质心和“摆动半径”,分别是第一和第二时刻。这些量在统计中对应于平均值和测量值在平均值周围的分布或分散。

并且因为:

Pearson 处理离散的测量间隔,这是一个和而不是一个积分

惯性矩可以代表运动物体的总结:可以像将物体简化为一个点一样进行计算。

皮尔逊将这五个等式设置为一个方程组,组合成一个九级。只有通过逐次逼近才能得到数值解。可能有多达九个真正的解决方案,尽管在目前的例子中只有两个。他将这两个结果与原始结果一起绘制,并且总体上对结果的外观感到满意。然而,他并没有依靠目测来决定他们之间的关系,而是计算出第六时刻来决定最佳匹配。

让我们回到物理学。矩是考虑物理属性的局部排列的物理量,通常相对于某个序数点或轴(通常在空间或时间中)。它总结了在距参考点一定距离处测量的物理量。如果数量没有集中在一个点上,则通过积分或求和的方式在整个空间上“平均”该时刻。

显然,矩的概念可以追溯到阿基米德“发现”杠杆的工作原理。第一个已知的事件是拉丁词“momentorum”,具有现在公认的意义(关于旋转中心的力矩)。1565 年,Federico Commandino 将阿基米德的著作 (Liber de Centro Gravitatis Solidorum) 翻译为:

每个立体图形的重心是它内部的那个点,等矩的所有部分都围绕该点站立。

或者

Centrum gravitatis uniuscuiusque solidae figurae est punctum illud intra positum, circa quod undique partes aequalium momentorum

显然,与物理学的类比是相当强的:从一个复杂的离散物理形状中,找到足够接近它的量,一种压缩或简约的形式。

问题:那么在这种情况下,“时刻”这个词是什么意思?为什么选择这个词?这对我来说听起来并不直观(或者我在大学里从来没有这样听过:)想想看,我同样对它在“惯性矩”中的用法感到好奇;)但现在我们不要专注于此。

答:实际上,在历史意义上,惯性矩可能就是矩这个词的含义。实际上,可以(如下所示)显示惯性矩与方差的关系。这也产生了对更高时刻的物理解释。

在物理学中,是距离和物理量乘积的表达式,它说明了物理量是如何定位或排列的。力矩通常是相对于固定参考点定义的;它们处理在距该参考点一定距离处测量的物理量。例如,作用在物体上的力矩(通常称为扭矩)是力与与参考点的距离的乘积,如下例所示。

在此处输入图像描述

比通常给出的名称更容易混淆,例如,用于更高力矩的超平坦度等将是来自圆周运动的力矩,例如,用于圆周运动的惯性矩, 刚体,这是一个简单的转换。角加速度是角速度的导数,是角度对时间的导数,即$ \dfrac{d\omega}{dt}=\alpha,\,\dfrac{d\theta}{dt}= \欧米茄$。考虑到二阶矩类似于应用于圆周运动的扭矩,或者如果您将对该圆周(即角度,$\theta$)运动进行加速/减速(也是二阶导数)。类似地,三阶矩将是转矩变化率,依此类推,对于更高的矩,以产生变化率的变化率,即圆周运动的顺序导数。这可能更容易通过实际示例来可视化。

物理上的合理性是有限制的,例如,一个对象在哪里开始和结束,即它的支持,这使得比较或多或少是现实的。让我们以 beta 分布为例,它在 [0,1] 上具有(有限)支持,并显示其对应关系。贝塔分布密度函数 ( pdf ) 是 $$\beta(x;\alpha,\beta)=\begin{array}{cc} \Bigg\{ & \begin{array}{cc} \dfrac{x^{ \alpha -1} (1-x)^{\beta -1}}{B(\alpha ,\beta )} & 0<x<1 \\ 0 & \text{True} \\ \end{array} \\ \end{数组}\,,$$ 其中$B(\alpha,\beta)=\dfrac{\Gamma(\alpha)\,\Gamma(\beta)}{\Gamma(\alpha+\beta) }$,$\Gamma(.)$ 是gamma 函数,$\Gamma(z) = \int_0^\infty x^{z-1} e^{-x}\,dx$。

然后,平均值是beta 函数$z$ 轴旋转的第一时刻,该函数绘制为刚性旋转的均匀面积密度薄片,最小 $x$ 值附加到 (0,0,0) 原点,其底在 $x,y$ 平面上。$$\mu=\int_0^1r\,\beta(r;\alpha,\beta)\,dr=\frac{\alpha}{\alpha+\beta}\,,$$ 如 $\beta( r;2,2)$,即 $\mu=\dfrac{1}{2}$,如下 在此处输入图像描述

请注意,没有什么可以阻止我们将 beta 分布薄片移动到另一个位置并重新缩放它,例如,从 $0\leq r\leq1$ 到 $2\leq r\leq4$,或者改变垂直形状,例如做一个桨而不是一个驼峰。

为了计算 beta 分布方差,我们将计算移动 beta 分布的转动惯量,其中 $r$ 值均值放置在 $z$ 旋转轴上,$$\sigma^2=\int_0^1 ( r-\mu)^2 \beta(r;\alpha,\beta) \, dr =\frac{\alpha \beta }{(\alpha +\beta )^2 (\alpha +\beta +1)} \,,$$ 对于 $\beta(r;2,2)$,即 $I=\sigma^2=\dfrac{1}{20}$,其中 $I$ 是惯性矩,看起来像这样,

在此处输入图像描述

现在对于更高的所谓“中心”矩,即关于均值的矩,如偏度和峰度,我们从 $$\int_0^1 (r- \mu)^n \beta(r;\alpha,\beta) \, dr\,.$$ 这也可以理解为圆周运动的$n^{\text{th}}$导数。

如果我们要逆向计算,也就是取一个 3D 立体物体,把它变成一个概率函数呢?然后事情变得有点棘手。例如,让我们取一个环面在此处输入图像描述

首先我们取它的圆形横截面,然后我们把它做成半椭圆来显示任何扁平硬币的密度,然后我们将硬币转换成楔形硬币,以说明密度随着距离的增加而增加($r $) 从 $z$ 轴开始,最后我们对区域进行归一化以生成密度函数。这在下面以图形方式概述,数学留给读者。

在此处输入图像描述

最后,我们问这些等价如何与运动相关?请注意,如上所述,惯性矩 $I$ 可以与第二个中心矩 $\sigma^2$,AKA,方差相关。那么$I=\dfrac{\tau}{a}$,即扭矩$\tau$与角加速度$a$的比值。然后,我们将进行微分以获得更高的时间变化率。

由于过于简单化,统计矩是曲线/分布的附加描述符。我们熟悉前两个矩,它们通常对连续正态分布或类似曲线很有用。然而,前两个时刻对于其他分布失去了信息价值。因此,其他矩提供了关于分布形状/形式的附加信息。