特征工程通常是机器学习的重要组成部分(它在 2010 年被大量用于赢得 KDD 杯)。但是,我发现大多数特征工程技术
- 破坏底层特征的任何直观含义或
- 非常特定于特定领域甚至特定类型的功能。
前者的一个经典例子是主成分分析。在我看来,主题专家对这些特征的任何了解都会因将这些特征转换为主成分而被破坏。
与将日期转换为“月中日”和“周中日”的特征的简单技术进行对比。新功能中仍然保留了基本含义,但显然这种特殊技术仅适用于日期,而不适用于任意功能。
是否有任何标准的特征工程技术体系不会破坏底层特征的含义,同时也适用于任意领域(或至少是各种各样的领域)?