对我来说,从贝叶斯的角度来看,在许多情况下,关于 iid 到底是什么以及为什么会这样的概念,一个必要的假设更有意义。在这里,数据并没有被认为是绝对意义上的独立同分布,而是在给定模型参数的情况下被认为是有条件的独立同分布。
例如,从贝叶斯的角度考虑一个正常模型。在给定参数的情况下,我们指定我们认为数据是如何采样的:
Xi|μ,σ2∼iidN(μ,σ2)为了i∈{1,…,n},
并表达对这些参数的先验信念:
μ∼P(μ) ; (使用的确切先验并不重要)。σ2∼P(σ2)
条件独立与可能性因式分解的事实有关:
P(X1,…,Xn|μ,σ2)=P(X1|μ,σ2)…P(Xn|μ,σ2)。
但这与说我们的模型隐含的数据的边际分布分解:
P(X1,…,Xn)≠P(X1)…P(Xn)。
而且,确实,在我们的正态分布的具体情况下,通过整合参数来获得数据的边际分布确实会产生一个通常不独立的联合分布,其形式将取决于您指定的先验。
也就是说:两个观测值和不独立;它们仅在给定模型参数的情况下是条件独立的(在数学符号中,但) .XiXjXi⊥⊥Xj|μ,σ2Xi⊥̸⊥Xj
思考两个随机变量的独立性意味着什么的一个有用方法是它们不提供任何关于彼此的信息。说两个数据点不提供任何关于彼此的信息是完全荒谬的:当然,数据在某种程度上是相关的。但是通过在给定一些参数的情况下使数据有条件地独立,我们说我们的模型编码了数据之间的整个关系:我们的模型“没有任何遗漏”。
实际上,独立同分布假设是对我们的模型正确的假设:如果我们的模型中遗漏了某些内容,则数据将包含超出我们模型中编码内容的信息。如果我们知道那是什么,我们应该把它放到我们的模型中,然后做出一个独立同分布的假设。如果我们不知道它是什么,我们就不走运了。但是,我们错误地指定了模型是一个持续且不可避免的风险。
最后,一个简短的说明:乍一看,我描述的这个框架似乎不适合诸如时空模型之类的模型,在这些模型中,我们在硬编码到模型中的数据之间有明确的依赖关系。但是,在我知道的所有此类情况下,模型都可以重新参数化为具有独立同分布数据和其他(可能相关的)潜在变量的模型。