“稀疏先验”一词指的是什么(FBProphet 论文)?

机器算法验证 回归 贝叶斯 预测
2022-01-27 18:15:33

阅读论文“大规模预测”(FBProphet 预测工具,请参阅https://peerj.com/preprints/3190.pdf),我遇到了“稀疏先验”一词。作者解释说,他们使用这种“稀疏先验”来建模与某个标量速率,这是逻辑增长模型中的模型参数。δk

正如他们所说的很小,我是否正确理解“稀疏”是指携带接近零的元素的向量?我很困惑,因为我认为所有向量元素都需要是回归的参数,但是像这样定义它们只会将参数作为自由模型参数,不是吗?δjLaplace(0,τ)τkτ

另外,是否使用拉普拉斯分布来生成先验共同点?我不明白为什么它比正态分布更受欢迎。

1个回答

稀疏数据是具有许多零的数据。在这里,作者似乎将先验称为稀疏,因为它喜欢零。如果您查看拉普拉斯(又名双指数)分布的形状,这是不言自明的,它在零附近达到峰值。

(图片来源 Tibshirani,1996 年)

的任何值,这种效果都是正确的(分布总是在其位置参数处达到峰值,这里等于零),尽管参数的值越小,它的正则化效果就越大。τ

出于这个原因,拉普拉斯先验经常被用作鲁棒先验,具有正则化效果。话虽如此,拉普拉斯先验是流行的选择,但如果您想要真正稀疏的解决方案,可能会有更好的选择,如 Van Erp 等人(2019)所述。

Van Erp, S.、Oberski, DL 和 Mulder, J. (2019)。贝叶斯惩罚回归的收缩先验。 数学心理学杂志,89,31-50。doi:10.1016/j.jmp.2018.12.004