我对无监督学习的理解是——当您希望计算机通过检查大型数据集自行学习时。目标是从给定的输入中建立某种形式的集群或基于关联的数据分组,即“查找模式 - 已知/未知”
所以我的问题是——“现在我们该怎么处理它?” - 例如,我现在已经使用无监督学习识别出一种模式。我现在是否正在寻找监督学习来增强我的数据洞察工作?或者,我是否作为一个人/团队/委员会做出决定,根据这些决定做某些事情?
我对无监督学习的理解是——当您希望计算机通过检查大型数据集自行学习时。目标是从给定的输入中建立某种形式的集群或基于关联的数据分组,即“查找模式 - 已知/未知”
所以我的问题是——“现在我们该怎么处理它?” - 例如,我现在已经使用无监督学习识别出一种模式。我现在是否正在寻找监督学习来增强我的数据洞察工作?或者,我是否作为一个人/团队/委员会做出决定,根据这些决定做某些事情?
无监督学习是一组工具,您可以将这些工具用于多种用途。
有时,它只是用于数据可视化/数据探索(例如,参见 UMAP),以更好地理解问题并了解如何解决它。有时它会导致业务决策,例如为特定集群构建流程或为特定集群构建子模型。
有时它有助于处理数据科学的子问题,例如异常值识别(例如,参见 Hdbscan 或隔离森林)。如何处理这些异常值取决于您的业务案例。
有时它有助于定义中间“目标”以执行半监督或监督学习,例如使用一些自组织的地图,识别一个集群并将该集群用作目标。当您不确定是否已确定所有积极目标或不想标记所有内容时,它会有所帮助。
两者都可以,意思是
a)寻找监督学习来增强我的数据洞察力
b)作为一个人/团队/委员会做出决定,根据这些决定做某些事情
这意味着什么?
在 a) 的情况下,您可以将无监督学习视为表示学习——这意味着您学习数据的最佳量化表示,然后在最后,即例如最后一层,您添加一个输出神经元以产生二进制分类。比您重新训练(显然需要标签)您的“无监督学习网络”来调整它以进行分类
b) 例如,您分析无监督任务的集群。您可以在其中构建一个系统以将输入数据排序到这些集群中,并且您可以分析关系(这不需要标签,这显然只是无监督方法的一个示例)