在训练之前通过 PCA 降低维度是一种常见的做法,但 PCA 不能利用特征之间的非线性关系。
我读到了 UMAP(例如https://adanayak.medium.com/dimensionality-reduction-using-uniform-manifold-approximation-and-projection-umap-4aa4cef43fed),一种能够理解非线性的降维技术特征之间的关系。
但是,我只看到了它在数据表示和探索中的用途。在为下游模型训练创建输入时,使用 UMAP 作为特征工程/降维的一种形式是否有意义?