分布未知时贝叶斯统计的替代方案

机器算法验证 贝叶斯 后部
2022-01-22 22:03:18

在贝叶斯统计中,我的变量是高斯分布的,并且我有一个共轭先验,我可以解析地求解后验。只要我指定一个分布,我仍然可以在事物非高斯的情况下使用 MCMC。但是如果我不知道合适的分布是什么?我正在处理已知为非高斯分布的财务数据(尾部较重且相对于正态分布偏斜)。据我所知,金融数据的确切分布仍有待学术界争论。如果我不想对数据的分布方式做出强有力的假设,还有什么替代方案?

4个回答

如果数据的分布未知,处理这种不确定性的贝叶斯方法是先验。有大量关于贝叶斯非参数的文献,包括Ghosal 和 van der Vaart 的非参数贝叶斯推理基础此类设置中的默认先验是分布上的分布,例如 Dirichlet 过程。检查例如由Peter Orbanz维护的关于贝叶斯非参数的网页教程这是给我们学生的开创性论文清单。

关于 MCMC,也存在处理贝叶斯非参数的 MCMC 算法。例如,参见Dey 等人的这本书。还要检查这个论坛上的dirichlet-process标签。

更温和的解决方案是使用贝叶斯模型平均,即列出所有(!)可以拟合数据的似是而非的家庭,为每个家庭选择一个参考先验,并将后验混合用于感兴趣的数量[所有家庭通用] .

从您所说的来看,您想要贝叶斯的东西,但您无法定义可能性。对于这种情况,有近似的贝叶斯计算(见),代替可能性,您使用一些汇总统计数据。

作为旁注,要使用正确的贝叶斯分析,您不需要知道“精确”分布。我们几乎从不这样做。您需要使用一些相对较好地近似数据分布的分布。这就是大多数统计数据的完成方式。我们不使用高斯、泊松等分布,因为它们是观测数据的精确分布,但它们是足够好的近似值。与损失函数一样,您不使用平方误差,因为它对您的数据有一些深刻的含义,而是因为它足够好。

尽管其他答案还可以,但我认为它们对于您的答案或许多其他问题可能有些过分。

在不改变范式的情况下,如果您知道分布的尾部比高斯分布更重,您可以使用固定的尾部重度或可能使用先验信息从数据估计的尾部重度来拟合 t 分布。

如果分布偏斜且尾部较重,则可以拟合一个 SHASH 分布,该分布具有四个参数,将分布的位置、尺度、偏度和峰度参数化,正态分布作为其特例。

我建议作为基于引导程序的替代方法,它可以是参数的,也可以不是参数的,并且可以使用很少的假设和很少的数据(仅 5-7 个样本就足够了);它适用于非高斯分布和许多度量(例如,平均值等)。如果在给定的上下文中有意义,则可以通过引导均值来“重建”分布。戴维森1一般适合介绍引导程序。

许多论文发表了关于通过基于引导的方法分析的波动率微笑 [0]。

  1. https://scholar.google.com/scholar?q=bootstrap+volatility+smile
  2. Davison, AC 和 Hinkley, DV, 1997。Bootstrap 方法及其应用(第 1 期)。剑桥大学出版社。
  3. 作为贝叶斯模型的非参数引导程序