狄拉克的 delta 函数是否应该被视为高斯分布的子类?

机器算法验证 分布 正态分布 狄拉克三角洲
2022-03-15 08:08:57

在 Wikidata 中,可以将本体中的概率分布(与其他所有内容一样)联系起来,例如,t 分布是非中心 t 分布的子类,参见,例如,

https://angryloki.github.io/wikidata-graph-builder/?property=P279&item=Q209675&iterations=3&limit=3

存在各种限制情况,例如,当 t 分布的自由度趋于无穷大或正态分布(高斯分布)的方差接近零时。在后一种情况下,分布将​​趋向于狄拉克的 delta 函数。

我注意到,在英语维基百科上,方差参数目前被声明为大于零,因此严格解释不会说狄拉克的 delta 函数是正态分布的子类。但是,对我来说这似乎还不错,因为我会说指数分布是狄拉克三角函数的超类。

说狄拉克的 delta 函数是高斯分布的子类有什么问题吗?

3个回答

狄拉克三角洲在方便的时候被认为是高斯分布,而当这个观点需要我们做出例外时则不这样认为。

例如,是实数的所有选择的高斯随机变量,则称 (X_1, X_2, \ldots, X_n)享受 多元高斯分布(注意:这是“高级”统计中的标准定义)。由于一个选择是,标准定义将常数(退化随机变量)视为高斯随机变量(均值和方差)。另一方面,当我们考虑类似的东西时,我们忽略了将狄拉克三角洲视为高斯分布(X1,X2,,Xn)iaiXia1,a2,,ana1=a2==an=000

的零均值高斯随机变量的累积概率分布函数 (CDF) 其中是标准高斯随机变量的 CDF。"σ

FX(x)=P{Xx}=Φ(xσ)
Φ()

请注意,(因此作为高斯随机变量) 的零均值高斯随机变量序列的极限情况,则该陈述几乎是正确的,但并不完全正确。狄拉克三角洲的 CDF对于01x0

limσ0Φ(xσ)={0,x<0,12,x=0,1,x>0.
但是,很多人会告诉你,将狄拉克三角洲视为高斯分布纯粹是胡说八道,因为他们的书说高斯随机变量的方差必须是正数(其中一些人会否决这个答案以显示他们的不满)。几年前在 stats.SE 上对这一点进行了非常激烈和富有启发性的讨论,但不幸的是,它只是在答案的评论中(我相信是@Macro)而不是作为个人答案,我再也找不到它了.

delta 函数符合分布的数学理论(这与概率分布理论完全不同,这里的术语再混乱不过了)。

本质上,分布是广义函数。它们不能像函数一样被评估,但可以被集成。更准确地说,分布定义如下D

测试函数的集合。一个测试函数是一个真实的、诚实的函数,平滑,具有紧凑的支持。一个分布是一个线性映射TθD:TR

诚实函数通过积分算子确定分布f

T(θ)=+f(x)θ(x)dx

有些分布与真实函数无关,狄拉克算子就是其中之一

δ(θ)=θ(0)

从这个意义上说,您可以将狄拉克视为正态分布的极限情况。如果是均值为零且方差的 pdf 正态分布族,则对于任何测试函数Nttθ

θ(0)=limt0+Nt(x)θ(x)dx

这可能更常见地表示为

θ(0)=+δ(x)θ(x)dx=limt0+Nt(x)θ(x)dx

数学家会认为这是对符号的滥用,因为表达式实际上没有任何意义。但话又说回来,是谁来批评狄拉克,谁是最好的。δ(x)

当然,这是否使狄拉克成为正态分布家族的成员是一个文化问题。在这里,我只是给出一个理由,为什么考虑它可能是有意义的。

不,它不是正态分布的子类。

我认为混淆来自狄拉克函数的一种表示。请记住,它的定义如下:

δ(x)dx=1
δ(x)=0,x0

它被定义为一个积分,这很好,但有时您需要通过函数表示而不是积分来操作它。于是,人们想出了各种各样的替代方案,其中一个看起来像高斯密度:

δ(x)=limσ0ex22σ22πσ

然而,这不是唯一的表示,例如有这个:

δ(x)=12πk=eikx,x(π,π)

因此,最好根据积分定义来考虑狄拉克函数,并将函数表示,例如高斯,作为方便的工具。

更新到@whuber 的观点,一个更好的例子是这个狄拉克三角洲的表示:

δ(x)=limσ0e|x|σ2σ

这看起来像拉普拉斯分布吗?我们不应该把狄拉克三角洲看作拉普拉斯分布的一个子类吗?