简单地说:探索性数据分析的贝叶斯和频率论方法有什么不同吗?
我知道 EDA 方法中没有固有的偏差,因为直方图是直方图,散点图是散点图等,我也没有找到 EDA 教学或呈现方式差异的示例(忽略 A. Gelman 的特别理论论文) . 最后,我查看了 CRAN,它是所有应用程序的仲裁者:我还没有找到适合贝叶斯方法的软件包。但是,我认为 CV 可能有一些人可以对此有所了解。
为什么会有差异?
对于初学者:
- 在确定适当的先验分布时,不应该直观地进行调查吗?
- 在汇总数据并建议使用常客模型还是贝叶斯模型时,EDA 不应该建议走哪个方向吗?
- 这两种方法在如何处理混合模型上有非常明显的区别。确定一个样本可能来自混合人群具有挑战性,并且与用于估计混合参数的方法直接相关。
- 这两种方法都包含随机模型,并且模型的选择是通过理解数据来驱动的。更复杂的数据或更复杂的模型需要更多的时间在 EDA 中。由于随机模型或生成过程之间存在这种区别,EDA 活动存在差异,那么不同的随机方法不应该产生区别吗?
注 1:我不关心任何一个“阵营”的理念——我只想解决我的 EDA 工具包和方法中的任何差距。