理论分布和经验分布有什么区别?

机器算法验证 分布 数理统计
2022-03-08 16:15:45

现在,我对这两种分布之间的区别感到非常困惑。我认为理论上意味着我们已经知道其所有信息的给定分布。但是,对于经验分布,我们也知道有关它的所有信息。它们之间到底有什么区别?

例如,

在 R 中,dnorm():获得理论正态分布的密度值;为什么它不是经验正态分布?

在 R 中,density():将经验密度曲线拟合到一组值;为什么在这种情况下,它使用“经验”?

3个回答

简而言之,当您知道分布是什么及其参数时,您就可以构建理论分布。

因此,在 R 的情况下,该dnorm命令返回标准正态分布。即概率密度函数为: 并且我们知道所以我们实际上有

f(x|μ,σ)=1σ2πe(xμ)22σ2
μ=0σ=1
f(x)=12πex22
P(Xx)=0x12πet22dt

那是因为我们开始知道一切。

使用 EMPIRICAL 分布,我们开始一无所知我们拥有的是一组观察结果,我们想尝试从该集合中获得一些知识。也许我们会拟合一个分布,也许如果我们有足够的观察结果,我们就可以从中进行测量。

例如,如果我有以下 10 个数字,我可以创建一个经验分布:1,2,3,4,4,5,8,9,9,10

仅看这些数字,选择 5或更少的经验概率为 60%,因为我有 10 个观察值中有 6 个为 5 或更少。

所做的是density通过观察集合运行并为它们拟合核平滑密度它不是正常的、二项式的、泊松的、帕累托的,或者任何特别的必然。它是直方图的(有时)平滑版本,可以将其视为与观察相关的计算的密度。我们可以尝试拟合以某种方式“接近”经验的理论分布。然后可以将这些拟合的理论分布用作代理,我们可以使用它们的属性来获得更多乐趣和游戏。

简而言之,经验分布会根据经验样本发生变化,而理论分布不会因来自它的样本而发生变化。

或者换一种说法,经验分布是由样本决定的,而理论分布可以决定从中得出的样本。

事件的经验概率是根据收集数据或运行实验(在大量试验中)后事件发生的频率对事件发生的“估计”。它特别基于直接观察或经验。

事件的理论概率是事件可能发生的方式数除以结果总数。它正在寻找来自已知同样可能结果的样本空间的事件概率。

http://www.regentsprep.org/regents/math/algebra/apr5/theoprop.htm