最近我正在阅读 2001 年的一篇论文,Michael D. Ernst、Jake Cockrell、William G. Griswold、David Notkin Dynamicly Discovering Likely Program Invariants to Support Program Evolution TSE 2001,在这篇论文中,它说,
贝叶斯和 PAC 学习等学习方法假设输入数据中有噪声,因此分类不准确是可以接受的,甚至是有益的。
我从来不知道贝叶斯会从嘈杂的数据中受益。所以,我的问题是:
- 嘈杂的数据真的会让贝叶斯受益吗?如果是这样,它会提高准确性还是只是加速模型?
- 这里的“嘈杂数据”到底是什么意思?因为我试图检查一些资源,一篇论文说,嘈杂的数据会加速 EM,而那里的嘈杂数据意味着潜在数据或缺失数据。我觉得EM与贝叶斯有一些联系,所以我想知道是否有任何联系......