是否可以为无监督机器学习问题进行特征选择?

数据挖掘 特征选择 无监督学习
2021-09-18 00:19:37

我开始寻找在机器学习中进行特征选择的方法。

通过快速浏览这篇 文章,我假设特征选择仅适用于监督学习问题:

图片来自链接

尽管如此,我还是要问:是否有方法可以在没有已知变量的情况下进行特征选择以用于分类/回归问题?

4个回答

特征选择是一种在我们知道目标变量时使用的技术(监督学习)

当我们谈论无监督学习时,没有确切的技术可以做到这一点。但是在这些方面有一些东西可以帮助我们,即降维,这种技术用于减少特征的数量并为我们提供最能解释数据集的特征。这些特征将从现有特征派生,并且可能是也可能不是相同的特征。

有不同的技术可用于这样做:

  1. 主成分分析
  2. 线性判别分析
  3. 非负矩阵分解
  4. 广义判别分析等等。

特征选择的结果将是对目标变量解释最多的相同特征,但降维的结果可能与从给定输入派生的特征相同,也可能不同。

有一些方法可以在无监督场景中进行特征选择:

  • 拉普拉斯分数特征选择;
  • 光谱特征选择
  • GLSPFS 特征选择;
  • JELSR 特征选择
  • 过滤低方差特征(此处的实现)
  • 过滤相关特征(可以使用corr()from pandas实现)