数据挖掘 - 我所做的是有监督的还是无监督的机器学习？ - 吾爱随笔录

我所做的是有监督的还是无监督的机器学习？

数据挖掘机器学习监督学习主题模型无监督学习低密度脂蛋白

2022-02-23 14:30:10

我的目标是从 Twitter获取智能手机名称。所以这就是我所遵循的：

1- 我使用关键字“智能手机”提取了 10 万条推文。

2- 我在应用 ngram 标记化和清理后应用了 LDA。所以，我得到了嘈杂的结果，例如：(giveway, international, apple, iphone_6, samsung_s5,news...)

3- 我使用从 DBpedia 中提取的智能手机列表（iphone_6、samsung_s5、iphone_4s、...）过滤了结果，以消除噪音。

我所做的是有监督的还是无监督的机器学习？

1个回答

监督和无监督学习背后的基本思想是：在supervised learning中，一个人拥有一个training data set包含所需target输出特征的 a。流行的监督学习算法的示例是线性回归和支持向量分类等。在unsupervised learning中，我们没有具有目标输出特征的训练数据集，即我们不知道我们的输出或结果是什么样的。一个例子是聚类。关于这一点，确实有很好的解释。

LDA 是一种无监督学习算法，您描述的过程可以归类为无监督学习。您描述的过滤步骤不会使算法受到监督，因为目标智能手机与训练数据没有直接关联，因此仅作为限制目标变量基数的指南。

其它你可能感兴趣的问题

上一篇归一化和均值居中数据有什么作用？下一篇将使用 ImageNet 预训练的过滤器转换为灰度？