虽然我喜欢认为我很好地掌握了贝叶斯统计分析和决策中的先验信息的概念,但我常常难以理解它的应用。我想到了几个例子来说明我的挣扎,我觉得到目前为止我读过的贝叶斯统计教科书没有正确解决它们:
假设几年前我进行了一项调查,表明 68% 的人有兴趣购买 ACME 产品。我决定再次进行调查。虽然我将使用与上次相同的样本量(例如,n=400),但从那时起人们的意见可能已经发生了变化。但是,如果我使用 beta 分布作为先验,其中 400 名受访者中有 272 人回答“是”,我会给予我几年前进行的调查和我现在进行的调查同等的权重。是否有一个经验法则可以确定我想放在先验的更大不确定性,因为该数据已有几年的历史?我知道我可以将先验值从 272/400 减少到比如说 136/200,但这感觉非常武断,我想知道是否有某种形式的理由,也许在文献中,
再举一个例子,假设我们即将进行临床试验。在启动试验之前,我们进行了一些可以用作先前信息的二次研究,包括专家意见、先前临床试验的结果(相关性不同)、其他基本科学事实等。如何结合这些信息范围(其中一些本质上是非定量的)到先验概率分布?是否只是决定选择哪个家庭并使其足够分散以确保其被数据淹没,或者是否已经做了大量工作来建立一个信息量相当大的先验分布?