概率和非概率学习方法有什么区别?

机器算法验证 机器学习 可能性
2022-04-13 10:25:51

不同情况下的概率学习方法和非概率学习方法有什么区别?什么时候认为一个比另一个更合适?你能给我举个例子吗?

1个回答

分类任务可以进行简单的比较:

概率方法(例如随机森林)将为每个输入样本生成一组类别的概率分布。

确定性方法(例如 SVM)不对类的分布进行建模,而是分离特征空间并返回与样本来源空间相关联的类。

然而,每种概率方法都有可能简单地返回具有最高概率的类,因此看起来是确定性的。此外,反过来,基于到 SVM 中分离超平面的距离,可以计算并返回每个类的概率。

一般而言,概率方法更适合纳入关于答案的不确定性,并且可以提供有关预测安全程度的信息。此外,概率方法可能能够包含有关类分布的先验信息。

例子:

例如,如果您尝试根据身高预测性别,确定性方法将简单地选择一个分离点并说:

(完全编造的数字)

身高 >= 175 --> 男人

身高 < 175 --> 女人

因此,对于身高为 175 的样本,它会产生女性以及身高为 155 的样本。

在这种情况下,概率方法可以产生一个概率,例如高度为

155 ---> 男人(0.1),女人(0.9)和

175 --> 男人(0.49),女人(0.51)