数据挖掘 - Spark SVD 的问题 - 吾爱随笔录

我有以下数据集的维度：

行数：41174

专栏：439316

矩阵非常稀疏，对此，我想执行降维。我正在使用 Spark 的 computeSVD 函数来执行降维。

但是，我收到一条错误消息

线程“主”java.lang.IllegalArgumentException 中的异常：要求失败：k = 41174 和/或 n = 439314 太大而无法计算特征分解

但是我在以下数据集上运行了相同的 computeSVD，它运行得非常好。

行数：3502

栏目：103301

在这两种情况下，我都将“k”的值传递为行、列的最小值。我无法理解我在这里做错了什么。根据错误，问题出在 K 上。如何解决上述错误。另外，关于如何确定 K 的任何想法？

参考