从专家那里获得先验

机器算法验证 贝叶斯 事先的 引出
2022-02-04 10:00:03

在拟合贝叶斯模型时,我应该如何从专家那里得到先验分布?

4个回答

我目前正在为我的硕士论文研究试用轮盘赌方法作为一种启发技术。这是一种图形方法,允许专家表示她对不确定数量的主观概率分布。

专家们被给予代表相同密度的计数器(或可以认为是赌场筹码),其总和为 1 - 例如 20 个筹码的概率 = 每个 0.05。然后指示他们将它们排列在预先打印的网格上,用 bin 表示结果间隔。每列将代表他们对获得相应 bin 结果的概率的信念。

示例:要求学生预测未来考试的分数。下图显示了用于引出主观概率分布的完整网格。网格的水平轴显示了要求学生考虑的可能的分档(或标记间隔)。顶行中的数字记录了每箱的筹码数量。完成的网格(总共使用 20 个筹码)表明学生认为分数在 60 到 64.9 之间的可能性为 30%。

支持使用这种技术的一些原因是:

  1. 许多关于专家主观概率分布形状的问题都可以得到回答,而无需向专家提出一连串的问题——统计学家可以简单地读出高于或低于任何给定点的密度,或任何两点之间的密度。

  2. 在引出过程中,如果专家对他们最初放置筹码的方式不满意,他们可以在筹码周围移动——这样他们就可以确定要提交的最终结果。

  3. 它迫使专家在提供的一组概率中保持一致。如果使用了所有筹码,则概率之和必须为 1。

  4. 图形方法似乎提供了更准确的结果,特别是对于统计复杂程度适中的参与者。

John Cook 给出了一些有趣的建议。基本上,从专家那里获得百分位数/分位数(不是平均值或模糊的比例参数!),并将它们与适当的分布相匹配。

http://www.johndcook.com/blog/2010/01/31/parameters-from-percentiles/

引出先验是一件棘手的事情。

引出概率分布和引出概率分布的统计方法是很好的先验引出实用指南。两篇论文中的流程概述如下:

  1. 背景和准备;
  2. 识别和招聘专家;
  3. 激励和培训专家;
  4. 结构化和分解(通常精确地决定应该引出哪些变量,以及如何在多变量情况下引出联合分布);
  5. 启发本身。

当然,他们还审查了启发如何产生可能适合或以其他方式定义分布的信息(例如,在贝叶斯环境中,Beta 分布),但非常重要的是,他们还解决了建模专家知识中的常见缺陷(锚定、窄和小尾分布等)。

我建议让主题专家指定先验的平均值模式,但我可以随意调整他们给出的比例大多数人并不擅长量化方差。

而且我绝对不会让专家确定分布族,尤其是尾部厚度。例如,假设您需要先验的对称分布。没有人能如此精确地指定他们的主观信念,以区分正态分布和具有 5 个自由度的 Student-t 分布。但在某些情况下,t(5) 先验比普通先验要健壮得多。总之,我认为尾部粗细的选择是一个技术统计问题,而不是量化专家意见的问题。