为什么使用bayesglm?

机器算法验证 贝叶斯 广义线性模型
2022-03-14 12:35:52

我的总体问题是:为什么要使用bayesglm而不是其他分类方法?

笔记:

  1. 我只对预测感兴趣。
  2. 我有大量的数据(~ 100,000 obs)。

我觉得样本量足够大,常规逻辑回归的参数将呈正态分布(CLT)。通过指定先验我会得到什么?我的直觉是它只对一个小数据集很重要,但我没有任何理论或应用证据。

1个回答

在工程以及供应链风险管理中,“工程知识”——例如受过教育的人的最佳猜测——可能是您拥有的最佳数据。例如,在没有额外数据的情况下,海啸发生和破坏供应链的可能性可以由该主题的专家估计(有更好的方法来构建先验)。随着时间的推移,海啸发生了,因此,我们获得了更多的数据,并且可以用后验(针对新数据调整的先验)更新我们的先验(工程知识)。在某些时候,会有太多的数据导致初始先验无关紧要,无论是谁做出的预测,你都会有相同的可能性预测。

我相信,如果你有这么多数据,“传统”频率论方法(通常)比贝叶斯方法更可取(当然其他人会不同意,尤其是在统计哲学之间进行选择而不是坚持一个并选择合适的方法)。请注意,频率方法完全有可能(并且经常发生)产生与贝叶斯方法相似/相同的结果。

也就是说,当方法的区别是一行代码时,为什么不实现多个方法并自己比较结果呢?