接受任何建议以从相关矩阵创建训练数据以找到奇数以识别变异差异

数据挖掘 神经网络 聚类 随机森林 异常检测
2022-02-15 10:28:50

我有 N 个通过随时间记录不同参数而获得的时变特征向量。这导致 N*N 相似性矩阵包含每个特征的一对一相关值。我们只需要考虑上三角矩阵,因为它是对称的,因此一个特征的相关值较低,对应于所有其他特征。是否有任何学习方法可以自主识别该特征。例如,矩阵看起来像这样

             Feature 1   Feature2 Feature 3 Feature 4
   Feature1  1           0.91      0.81       0.44
   Feature2  0.91          1       0.98       0.31
   Feature3  0.81       0.98       1          0.32
   Feature4  0.44       0.31       0.32        1

所以我们知道特征 4 的行为有所不同。任何可以学习这种差异并识别相应特征的学习方法。对不起,如果这是一个非常琐碎的问题,我是数据分析的新手。

1个回答

该问题通常以反面形式出现 - 找到具有高相关性的双变量特征,然后将其从模型中移除以增加可解释性并允许拟合某些模型。这通常称为多重共线性