在分层/关系结构化数据中进行特征工程的策略是什么?

数据挖掘 分类 回归 特征工程 分层数据格式
2022-03-06 10:20:33

我有一个功能集,每个功能都有自己的功能集,它们被布置在具有外键关系的 SQL 数据库中。目标是在顶级功能集上定义的,是一个二进制赢/输变量。

目标;
特征->子特征->子特征;
特征 -> 子特征;

所有的分类算法都需要一个平面特征文件作为输入。有哪些方法可以展平这样的结构化数据集,同时保留其他特征对子特征集的交叉特征依赖?

您将如何决定选择哪些子功能?目前,我正在汇总总胜利/尝试并回归(PCR)各个子功能以查看哪些子功能对最终目标有影响,选择这些的更通用的方法是什么?然后将这些组合成一个扁平化的特征?

如果有人能为这个练习找出正确的机器学习术语,我也将不胜感激。

0个回答
没有发现任何回复~