我正在研究概率建模,但我坚持从概率模型生成数据的概念。假设我已经建立了一个朴素贝叶斯分类模型,从中生成数据有什么意义?生成数据对我来说没有意义。希望有人能让我明白。
从概率模型(例如朴素贝叶斯分类器)生成数据的含义是什么?
机器算法验证
机器学习
贝叶斯
朴素贝叶斯
贝叶斯网络
2022-04-15 07:30:27
2个回答
[Naive] 贝叶斯是一种生成模型,这意味着我们可以根据需要使用它生成数据。在 NB 中,我们估计,其中是我们的特征向量,是类变量。例如,我们首先选择一个,然后根据概率分布选择单词。
具有从模型生成数据的能力可能出于多种原因很有用,例如
- 模拟来自模型的数据以判断您的模型对现实的表示是否合理,进行后验预测检查(将模拟数据的分布与经验数据进行比较),
- 如果您可以从模型中生成数据,您可以了解模型下可能出现的结果的分布,这是比点估计更丰富的信息,
- 如果您希望您的模型为用户提供建议,有时生成一组最可能的猜测比返回单个“最佳”预测更好(想想机器翻译或文本自动完成),
- 您可以从模型中模拟结果以检查它是否存在偏差,例如,您有一个模型可以帮助 HR 部门进行招聘,但是当您从模型中生成模拟结果时,您可以了解到某些少数族裔在模拟结果中没有代表性,所以这告诉你模型中可能存在对少数族裔的某种偏见。
另请参阅密切相关的线程何时使用模拟?
其它你可能感兴趣的问题