我所做的是有监督的还是无监督的机器学习?

数据挖掘 机器学习 监督学习 主题模型 无监督学习 低密度脂蛋白
2022-02-23 14:30:10

我的目标是从 Twitter获取智能手机名称。所以这就是我所遵循的:

1- 我使用关键字“智能手机”提取了 10 万条推文。

2- 我在应用 ngram 标记化和清理后应用了 LDA。所以,我得到了嘈杂的结果,例如:(giveway, international, apple, iphone_6, samsung_s5,news...)

3- 我使用从 DBpedia 中提取的智能手机列表(iphone_6、samsung_s5、iphone_4s、...)过滤了结果,以消除噪音。

我所做的是有监督的还是无监督的机器学习?

1个回答

监督和无监督学习背后的基本思想是:在supervised learning中,一个人拥有一个training data set包含所需target输出特征的 a。流行的监督学习算法的示例是线性回归和支持向量分类等。在unsupervised learning中,我们没有具有目标输出特征的训练数据集,即我们不知道我们的输出或结果是什么样的。一个例子是聚类。关于这一点,确实有很好的解释

LDA 是一种无监督学习算法,您描述的过程可以归类为无监督学习。您描述的过滤步骤不会使算法受到监督,因为目标智能手机与训练数据没有直接关联,因此仅作为限制目标变量基数的指南。