数据的贝叶斯分析

机器算法验证 贝叶斯 估计 计算统计 推理
2022-04-21 07:43:24

我有一个大数据集的形式:X1,X2,X3,X4,Y. 所有Xi,i1,...,4来自不同的未知分布和Y服从伯努利分布,所以它只能取值{0,1}. 问题是我如何预测Y鉴于观察到Xi. 据我所知,这可以使用二元逻辑回归来解决。此外,我们可以为 Y=1 的概率设置一个 0.95 的阈值,以估计 Y 的值(即如果 P(Y=1)>=0.95,那么我们估计 Y 为 1)一些给予信心。
这里出现的问题是我们是否可以使用(分层?)贝叶斯模型来解决估计 Y 值的相同问题。有什么建议吗?此外,是否有任何论文、书籍章节或教程可以解决相同的问题?据我所见,统计教科书涵盖了众所周知的分布的琐碎情况,我们可以在其中分析计算所有内容。但是,如果我有可以遵循任意分布的多维实验数据,那又如何呢?谢谢。

1个回答

如果你只是想预测Y然后是一个明确的联合模型XY什么时候X是 4 维可能是矫枉过正。如果您确实没有任何有关分发的信息,则尤其如此Xi的或之间的关系YX. 一个例外是,如果在X,或者可能是测量误差X. 贝叶斯二元回归方法将出现在任何关于应用贝叶斯方法的体面教科书中;我通常的推荐是 Gelman、Carlin、Stern 和 Rubin 的贝叶斯数据分析。