如何在 0 和 1 之间标准化奇异值分解 (SVD) 的结果?

数据挖掘 机器学习 统计数据 推荐系统 特征选择
2021-09-20 20:59:25

我正在构建一个推荐系统并使用 SVD 作为预处理技术之一。但是,我想在 0 和 1 之间标准化所有预处理数据,因为我的所有相似性度量(余弦、皮尔逊、欧几里得)都依赖于该假设。

在我采用 SVD (A = USV^T) 之后,是否有一种标准方法可以将矩阵“A”在 0 和 1 之间进行归一化?谢谢!

编辑:我希望我的所有相似性测量结果都在 0 和 1 之间,如果输入矩阵的值不在 0 和 1 之间,我的归一化欧几里得距离尤其会失败。

1个回答

奇异值分解是一种线性代数技术,因此很难定义归一化的概念。原则上,您可以通过将矩阵的每个元素 A(i,j) 除以该特定 (ith) 行中元素的总和(或最大值)来进行此归一化,即 A(i,j) = A(i , j) / \sum_{k=1}^{n} A(i,k)

然而,实现这一点的更优雅的方法是应用概率降维技术,例如PLSALDA这些降维技术确保您始终得到严格在 0 和 1 之间的概率值。