寻找距离矩阵相似的线性变换

数据挖掘 机器学习 公制 距离 线性代数 数学
2021-10-10 04:44:30

我有 n 向量集,其中每组 Si 包含 k 中的向量 Rd. 我知道有一些未知的线性变换W 在哪个距离矩阵下 Di (一个 k×k 矩阵)在所有集合中大致“相同”(即具有低方差) Si.

为了说明,可能对于每个向量中的每个 Si, 首先 k2数字是随机噪声,而后者k2每个人都一样i. 在这种情况下,W将恢复最后k2每个向量的元素。但实际上,向量的结构可能比这个玩具示例更复杂。

有没有学习的方法W- 要么使用直接线性代数方法,要么通过学习(例如,通过优化距离矩阵上的特定损失),而不找到简单的解决方案W是零映射,还是将所有向量映射到同一个向量的其他映射?

编辑:

我正在考虑的一种可能方法是在距离矩阵上应用典型相关分析 (CCA) 的变体。CCA 将相同数据的两个“视图”投影到共享子空间,从而最大化视图之间的总相关性;是否存在 CCA 的变体,其中视图不是向量对,而是向量集,每个向量都有一些内部结构(由距离矩阵表示)?而在 CCA 中,我们最大化了对之间的相关性,在这里我想最大化不同集合的距离矩阵之间的相关性。

谢谢

1个回答

我认为您正在搜索的内容与度量学习有关。PCA 是一种无监督学习方法,但也有等效的方法,您可以在其中引入标签信息来学习最佳线性变换,从而最大化来自不同标签的数据之间的距离。 http://contrib.scikit-learn.org/metric-learn/introduction.html#:~:text=Distance%20metric%20learning%20(or%20simply,%2C%20clustering%2C%20information%20retrieval)