数据挖掘 - 在分层/关系结构化数据中进行特征工程的策略是什么？ - 吾爱随笔录

我有一个功能集，每个功能都有自己的功能集，它们被布置在具有外键关系的 SQL 数据库中。目标是在顶级功能集上定义的，是一个二进制赢/输变量。

目标;
特征->子特征->子特征；
特征 -> 子特征；

所有的分类算法都需要一个平面特征文件作为输入。有哪些方法可以展平这样的结构化数据集，同时保留其他特征对子特征集的交叉特征依赖？

您将如何决定选择哪些子功能？目前，我正在汇总总胜利/尝试并回归（PCR）各个子功能以查看哪些子功能对最终目标有影响，选择这些的更通用的方法是什么？然后将这些组合成一个扁平化的特征？

如果有人能为这个练习找出正确的机器学习术语，我也将不胜感激。