我有一个功能集,每个功能都有自己的功能集,它们被布置在具有外键关系的 SQL 数据库中。目标是在顶级功能集上定义的,是一个二进制赢/输变量。
目标;
特征->子特征->子特征;
特征 -> 子特征;
所有的分类算法都需要一个平面特征文件作为输入。有哪些方法可以展平这样的结构化数据集,同时保留其他特征对子特征集的交叉特征依赖?
您将如何决定选择哪些子功能?目前,我正在汇总总胜利/尝试并回归(PCR)各个子功能以查看哪些子功能对最终目标有影响,选择这些的更通用的方法是什么?然后将这些组合成一个扁平化的特征?
如果有人能为这个练习找出正确的机器学习术语,我也将不胜感激。