贝叶斯和频率论的 EDA 方法是否存在差异?

机器算法验证 贝叶斯 常客 探索性数据分析
2022-01-25 11:30:17

简单地说:探索性数据分析的贝叶斯和频率论方法有什么不同吗?

我知道 EDA 方法中没有固有的偏差,因为直方图是直方图,散点图是散点图等,我也没有找到 EDA 教学或呈现方式差异的示例(忽略 A. Gelman 的特别理论论文) . 最后,我查看了 CRAN,它是所有应用程序的仲裁者:我还没有找到适合贝叶斯方法的软件包。但是,我认为 CV 可能有一些人可以对此有所了解。

为什么会有差异?

对于初学者:

  1. 在确定适当的先验分布时,不应该直观地进行调查吗?
  2. 在汇总数据并建议使用常客模型还是贝叶斯模型时,EDA 不应该建议走哪个方向吗?
  3. 这两种方法在如何处理混合模型上有非常明显的区别。确定一个样本可能来自混合人群具有挑战性,并且与用于估计混合参数的方法直接相关。
  4. 这两种方法都包含随机模型,并且模型的选择是通过理解数据来驱动的。更复杂的数据或更复杂的模型需要更多的时间在 EDA 中。由于随机模型或生成过程之间存在这种区别,EDA 活动存在差异,那么不同的随机方法不应该产生区别吗?

注 1:我不关心任何一个“阵营”的理念——我只想解决我的 EDA 工具包和方法中的任何差距。

2个回答

在我看来,贝叶斯与常客是关于形式推理的,而探索性数据分析两者都不是。

当然,当涉及到模型评估/拟合优度和敏感性分析时,我会对您的观点 (1)、(3) 和 (4) 进行分类,但在如何进行时会有差异,但是那是因为分析和计算方法之间的本质差异而不是哲学。

关于您的(2),我通常不认为 EDA 的结果将您指向贝叶斯或频率主义方法,而是我认为最重要的是研究的目标。

就我个人而言,EDA(加上深入的内省)将把我引向一个模型,如果我能找到一种自然的频率论方法来合理地回答科学问题,我会接受,但如果根据情况的性质,没有一种常客方法可以很好地工作,如果有一个合理的先验,我会使用贝叶斯。

我认为,EDA 可以帮助您建立模型、做出一些假设并(如果需要)更新模型及其假设。我选择一种语用学方法来进行模型拟合和评估。