我似乎无法在 Spark 中找到用于计算规范相关性的库。典型相关分析 (CCA) 在其他以数据科学为重点的系统中很常见。
这存在于 R 的基础和 Scikit 的 Python 中。Julia 的 Multivariate.jl 有它,但是很破。