我试图重新学习贝叶斯统计(每次我以为我终于明白了,其他一些我之前没有考虑过的东西突然出现......)但我不清楚(对我来说)数据生成过程是什么在贝叶斯框架中实际上是。
常客框架对我来说很清楚。有一些“真正的”参数并且该参数根据其参数化的分布生成数据。
但是,在贝叶斯设置中,我们将参数建模为随机变量。那部分不会让我感到困惑。这是有道理的,因为贝叶斯将这种概率解释为自己信念的不确定性。他们可以为不可重复的事件分配概率。所以我解释“贝叶斯主义”的方式是,它相信有一些参数生成数据,它肯定是未知的,但是一旦它被“自然”决定就固定了(也许自然确实随机决定了它应该是什么成为)。然而,它是固定的,因此它的创建是一个“不可重复的事件”。尽管它是不可重复的,但我们只是试图更新我们自己对给定的数据。因此,数据可能是由我们的概率分布(先验)考虑的任何参数生成的,但是,该参数是固定的且未知的。我们只是给它附加了一个概率值。
有了这种观点,我可以假设数据生成过程与常客的过程几乎相同。“自然”使用“真实”“先验”分布,一旦随机变量实现其“真实”(但固定)实现,它就会开始生成我们观察到的数据。
这是在贝叶斯框架中解释数据生成过程的标准方法吗?
关于我的观点的主要事情是,参数是明确固定的(被视为 rv 的实现),它根据生成数据。因此,我认为另一个非常重要的观点是,对我来说,我们的先验只是一种可量化的方式来表达我们的固定(和不可重复)事件的不确定性。这是人们如何解释先前的吗?
侧面幽默说明:
我希望可以问“自然”她是如何做到的,并一劳永逸地解决这个问题……哈哈。