监督学习和标签
数据挖掘
机器学习
监督学习
无监督学习
2021-09-28 02:45:31
2个回答
有监督学习和无监督学习的主要区别如下:
在监督学习中,您拥有一组标记数据,这意味着您拥有输入和输出的值。你试图通过机器学习来实现的是找到它们之间的真实关系,也就是我们通常所说的数学模型。机器学习中有许多不同的算法可以让您获得数据模型。您寻求的目标以及如何使用机器学习,是在您了解模型后,在给定新输入的情况下预测输出。
在无监督学习中,您没有标记数据。你可以说你有输入但没有输出。目标是在您的数据中找到某种模式。您可以找到您认为属于同一组或输出的组或集群。在这里,您还必须获得模型。同样,您寻求的目标是能够在给定新输入的情况下预测输出。
最后,回到你的问题,如果你没有标签就不能使用监督学习,你必须使用无监督学习。
那句话具有误导性。这是查看它的更好方法:
一个问题是受监督的还是不受监督的取决于您要解决的问题的性质。在监督学习问题中,您希望算法预测一些基本事实。基本事实可以是离散标签(分类)或连续域中的值(回归)。另一方面,无监督学习问题不会尝试“预测”某些标签或值。相反,它试图学习更好的数据表示或结构。聚类和降维都是无监督学习问题的例子。
现在,为了让您训练监督学习算法,您确实需要为其提供基本事实。缺乏标记数据不会使问题不受监督,这只意味着您必须花费精力来获取所需的标记数据,否则您将无法训练您的算法。实际上,为您拥有的所有数据获取标签/目标值通常是不现实的或过于昂贵。因此,当某些假设适用时,还有一类半监督算法使用标记数据和未标记数据进行监督学习。
简而言之,问题是否受到监督取决于问题的性质。有些问题需要你有标记的数据来训练你的学习算法,而有些则不需要,但是有没有标记的数据不应该改变你试图解决的问题的性质。
其它你可能感兴趣的问题