我已经读过,在数据集遇到机器学习模型之前对数据集应用某些常见的特征转换是有益的。这些基于数据集特征的分布;例如,将对数变换应用于偏态的正态分布特征。这里有一些例子。
现在据我了解,深度学习的主要好处是“自动特征工程”(又名“特征学习”)。我知道这包括功能组合;但我的预感说这还包括上述学习到的特征转换?因此,当使用具有良好调整的超级计算机的深度网络时,特征转换是否可以安全地从人类的职责中移除——也就是说,扔掉所有这些 log/square/box-cox 的东西?
[编辑]额外:这是否也为您处理“特征选择”(决定不包括哪些输入)?