在拟合贝叶斯模型时,我应该如何从专家那里得到先验分布?
从专家那里获得先验
我目前正在为我的硕士论文研究试用轮盘赌方法作为一种启发技术。这是一种图形方法,允许专家表示她对不确定数量的主观概率分布。
专家们被给予代表相同密度的计数器(或可以认为是赌场筹码),其总和为 1 - 例如 20 个筹码的概率 = 每个 0.05。然后指示他们将它们排列在预先打印的网格上,用 bin 表示结果间隔。每列将代表他们对获得相应 bin 结果的概率的信念。
示例:要求学生预测未来考试的分数。下图显示了用于引出主观概率分布的完整网格。网格的水平轴显示了要求学生考虑的可能的分档(或标记间隔)。顶行中的数字记录了每箱的筹码数量。完成的网格(总共使用 20 个筹码)表明学生认为分数在 60 到 64.9 之间的可能性为 30%。
支持使用这种技术的一些原因是:
许多关于专家主观概率分布形状的问题都可以得到回答,而无需向专家提出一连串的问题——统计学家可以简单地读出高于或低于任何给定点的密度,或任何两点之间的密度。
在引出过程中,如果专家对他们最初放置筹码的方式不满意,他们可以在筹码周围移动——这样他们就可以确定要提交的最终结果。
它迫使专家在提供的一组概率中保持一致。如果使用了所有筹码,则概率之和必须为 1。
图形方法似乎提供了更准确的结果,特别是对于统计复杂程度适中的参与者。
John Cook 给出了一些有趣的建议。基本上,从专家那里获得百分位数/分位数(不是平均值或模糊的比例参数!),并将它们与适当的分布相匹配。
http://www.johndcook.com/blog/2010/01/31/parameters-from-percentiles/
我建议让主题专家指定先验的平均值或模式,但我可以随意调整他们给出的比例。大多数人并不擅长量化方差。
而且我绝对不会让专家确定分布族,尤其是尾部厚度。例如,假设您需要先验的对称分布。没有人能如此精确地指定他们的主观信念,以区分正态分布和具有 5 个自由度的 Student-t 分布。但在某些情况下,t(5) 先验比普通先验要健壮得多。总之,我认为尾部粗细的选择是一个技术统计问题,而不是量化专家意见的问题。