现在,我对这两种分布之间的区别感到非常困惑。我认为理论上意味着我们已经知道其所有信息的给定分布。但是,对于经验分布,我们也知道有关它的所有信息。它们之间到底有什么区别?
例如,
在 R 中,dnorm():获得理论正态分布的密度值;为什么它不是经验正态分布?
在 R 中,density():将经验密度曲线拟合到一组值;为什么在这种情况下,它使用“经验”?
现在,我对这两种分布之间的区别感到非常困惑。我认为理论上意味着我们已经知道其所有信息的给定分布。但是,对于经验分布,我们也知道有关它的所有信息。它们之间到底有什么区别?
例如,
在 R 中,dnorm():获得理论正态分布的密度值;为什么它不是经验正态分布?
在 R 中,density():将经验密度曲线拟合到一组值;为什么在这种情况下,它使用“经验”?
简而言之,当您知道分布是什么及其参数时,您就可以构建理论分布。
因此,在 R 的情况下,该dnorm命令返回标准正态分布。即概率密度函数为:
并且我们知道和所以我们实际上有
和
那是因为我们开始知道一切。
使用 EMPIRICAL 分布,我们开始一无所知。我们拥有的是一组观察结果,我们想尝试从该集合中获得一些知识。也许我们会拟合一个分布,也许如果我们有足够的观察结果,我们就可以从中进行测量。
例如,如果我有以下 10 个数字,我可以创建一个经验分布:
仅看这些数字,选择 5或更少的经验概率为 60%,因为我有 10 个观察值中有 6 个为 5 或更少。
所做的是density通过观察集合运行并为它们拟合核平滑密度。它不是正常的、二项式的、泊松的、帕累托的,或者任何特别的必然。它是直方图的(有时)平滑版本,可以将其视为与观察相关的计算的密度。我们可以尝试拟合以某种方式“接近”经验的理论分布。然后可以将这些拟合的理论分布用作代理,我们可以使用它们的属性来获得更多乐趣和游戏。
简而言之,经验分布会根据经验样本发生变化,而理论分布不会因来自它的样本而发生变化。
或者换一种说法,经验分布是由样本决定的,而理论分布可以决定从中得出的样本。
事件的经验概率是根据收集数据或运行实验(在大量试验中)后事件发生的频率对事件发生的“估计”。它特别基于直接观察或经验。
事件的理论概率是事件可能发生的方式数除以结果总数。它正在寻找来自已知同样可能结果的样本空间的事件概率。
http://www.regentsprep.org/regents/math/algebra/apr5/theoprop.htm