我想使用无监督学习方法从(不失一般性)数值数据中提取特征:
- 转换:PCA/ICA/NMF
- 嵌入:T 分布的随机邻居嵌入。
- 基于集群的方法:k-means 或类似方法
- 基于内核:内核 PCA
我也考虑使用自动编码器或类似的。然后将提取的特征用于分类器。
我的问题:我一一研究这些方法。一些在原始上下文中(例如聚类)和一些在特征提取的上下文中。我缺乏细节方面的经验,并且出现了许多问题
- 我可以堆叠这些方法吗?我会失去什么?
- 我可以将它们应用于数据的子集(以减少训练时间)并预测其余部分吗?
因此:
网络上是否有教程/讲义/博客文章描述了这种意义上的特征提取的最佳实践?
PS:像这样的课程第 4 周:特征构建处理我的问题——我很想从应用的角度看到更多的例子。这个问题特征工程教程是相似的,但我希望我的不是重复的。