统计模型和概率模型之间的区别?

机器算法验证 可能性 数理统计
2022-02-14 23:28:41

应用概率是概率的一个重要分支,包括计算概率。由于统计学是使用概率论来构建模型来处理数据,据我所知,我想知道统计模型和概率模型之间的本质区别是什么?概率模型不需要真实数据?谢谢。

1个回答

概率模型三元组组成(Ω,F,P), 在哪里Ω是样本空间,F是一个σ−代数(事件)和P是一个概率测度F.

直观的解释概率模型可以解释为已知的 随机变量 X. 例如,让X是具有均值的正态分布随机变量0和方差1. 在这种情况下,概率测度P累积分布函数(CDF)相关联F通过

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

概括概率模型的定义取决于概率的数学定义,例如参见自由概率量子概率

统计模型 一个集合S概率模型,这是样本空间上的一组概率度量/分布Ω.

通常选择这组概率分布来对我们有数据的某种现象进行建模。

直观的解释在统计模型中,描述某种现象的参数和分布都是未知的。这方面的一个例子是具有均值的正态分布族μR和方差σ2R+,也就是说,这两个参数都是未知的,您通常希望使用数据集来估计参数(即选择S)。这组分布可以在任何ΩF,但是,如果我没记错的话,在一个真实的例子中,只有那些在同一对上定义的(Ω,F)是合理的考虑。

概括本文提供了一个非常正式的统计模型定义,但作者提到“贝叶斯模型需要先验分布形式的附加组件……尽管贝叶斯公式不是本文的主要重点”。因此统计模型的定义取决于我们使用的模型类型:参数或非参数。同样在参数设置中,定义取决于如何处理参数(例如经典与贝叶斯)。

不同之处在于:在概率模型中,您确切地知道概率度量,例如Normal(μ0,σ02), 在哪里μ0,σ02是已知参数。例如,在统计模型中,您会考虑一组分布Normal(μ,σ2), 在哪里μ,σ2是未知参数。

它们都不需要数据集,但我会说通常选择统计模型来建模。