机器算法验证 - 理论分布和经验分布有什么区别？ - 吾爱随笔录

理论分布和经验分布有什么区别？

机器算法验证分布数理统计

2022-03-08 16:15:45

现在，我对这两种分布之间的区别感到非常困惑。我认为理论上意味着我们已经知道其所有信息的给定分布。但是，对于经验分布，我们也知道有关它的所有信息。它们之间到底有什么区别？

例如，

在 R 中，dnorm()：获得理论正态分布的密度值；为什么它不是经验正态分布？

在 R 中，density()：将经验密度曲线拟合到一组值；为什么在这种情况下，它使用“经验”？

3个回答

简而言之，当您知道分布是什么及其参数时，您就可以构建理论分布。

因此，在 R 的情况下，该dnorm命令返回标准正态分布。即概率密度函数为：并且我们知道和所以我们实际上有和

f (x | μ, σ) = \frac{1}{σ \sqrt{2 π}} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}}

$f(x|\mu, \sigma) = \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{(x - \mu)^2}{2 \sigma^2}}$

μ = 0

$\mu = 0$

σ = 1

$\sigma = 1$

f (x) = \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}}

$f(x) = \frac{1}{\sqrt{2\pi}}\, e^{-\frac{x^2}{2}}$

P (X \leq x) = \int_{0}^{x} \frac{1}{\sqrt{2 π}} e^{- \frac{t^{2}}{2}} d t

$P(X \leq x) = \int_0^x \frac{1}{\sqrt{2\pi}}\, e^{-\frac{t^2}{2}}\; dt$

那是因为我们开始知道一切。

使用 EMPIRICAL 分布，我们开始一无所知。我们拥有的是一组观察结果，我们想尝试从该集合中获得一些知识。也许我们会拟合一个分布，也许如果我们有足够的观察结果，我们就可以从中进行测量。

例如，如果我有以下 10 个数字，我可以创建一个经验分布： ${1, 2, 3, 4, 4, 5, 8, 9, 9, 10}$

仅看这些数字，选择 5或更少的经验概率为 60%，因为我有 10 个观察值中有 6 个为 5 或更少。

所做的是density通过观察集合运行并为它们拟合核平滑密度。它不是正常的、二项式的、泊松的、帕累托的，或者任何特别的必然。它是直方图的（有时）平滑版本，可以将其视为与观察相关的计算的密度。我们可以尝试拟合以某种方式“接近”经验的理论分布。然后可以将这些拟合的理论分布用作代理，我们可以使用它们的属性来获得更多乐趣和游戏。

简而言之，经验分布会根据经验样本发生变化，而理论分布不会因来自它的样本而发生变化。

或者换一种说法，经验分布是由样本决定的，而理论分布可以决定从中得出的样本。

事件的经验概率是根据收集数据或运行实验（在大量试验中）后事件发生的频率对事件发生的“估计”。它特别基于直接观察或经验。

事件的理论概率是事件可能发生的方式数除以结果总数。它正在寻找来自已知同样可能结果的样本空间的事件概率。

http://www.regentsprep.org/regents/math/algebra/apr5/theoprop.htm

其它你可能感兴趣的问题

上一篇样本的标准偏差是否有一个术语，表示为平均值的百分比？下一篇什么是估计量的偏差和方差？