我的原始数据的列(特征)比行(用户)多得多。我正在尝试减少我的 SVD 的功能(我需要所有的行)。我在一本名为“Machine Learning in Action”的书中找到了一种这样做的方法,但我认为它不适用于我正在使用的数据。
方法如下。定义 SVD 为
设置优化阈值(即 90%)。计算对角线平方的总和矩阵。计算有多少达到总平方和的 90% 所需的值。所以如果结果是 100值,然后我会取的前 100 列矩阵,前 100 行矩阵和一个方阵出矩阵。然后我会计算使用简化矩阵。
但是,此方法不针对我的原始数据的列,因为结果的维度矩阵与之前相同。我将如何定位原始矩阵的列?