问题:对于 10 维 MCMC 链,假设我准备给您一个抽签矩阵:100,000 次迭代(行)乘 10 个参数(列),我怎样才能最好地识别后验模式?我特别关心多种模式。
背景:我认为自己是一位精通计算的统计学家,但当一位同事问我这个问题时,我很惭愧自己无法得出一个合理的答案。主要问题是可能会出现多种模式,但前提是至少考虑十个维度中的八个左右。我的第一个想法是使用核密度估计,但通过 R 搜索发现对于大于三个维度的问题没有任何希望。该同事提出了一个十维的临时分箱策略并寻找最大值,但我担心带宽可能会导致严重的稀疏问题或缺乏分辨多种模式的分辨率。也就是说,我很乐意接受有关自动带宽建议、指向 10 内核密度估计器的链接或您知道的任何其他内容的建议。
关注点:
我们认为分布可能相当偏斜;因此,我们希望识别后验模式而不是后验均值。
我们担心可能存在几种后验模式。
如果可能的话,我们更喜欢基于 R 的建议。但是任何算法都可以,只要实现起来不是非常困难。我想我不想从头开始实现具有自动带宽选择的 Nd 内核密度估计器。