具有秩相关的典型相关分析

机器算法验证 多元分析 数据转换 斯皮尔曼罗 肯德尔陶 典型相关
2022-02-13 05:24:20

典型相关分析 (CCA) 旨在最大化两个数据集的线性组合的通常 Pearson 积矩相关性(即线性相关系数)。

现在,考虑这个相关系数只测量线性关联这一事实——这就是我们还使用例如测量任意单调(不一定是线性)或 Kendall- (秩)相关系数的原因变量之间的联系。ρτ

因此,我想到了以下几点:CCA 的一个限制是,由于其目标函数,它仅试图捕获形成的线性组合之间的线性关联。在某种意义上通过最大化 Spearman-而不是 Pearson-来扩展 CCA 不是可能吗?ρr

这样的程序会导致任何统计上可解释和有意义的事情吗?(例如,在等级上执行 CCA 是否有意义......?)我想知道当我们处理非正常数据时它是否会有所帮助......

2个回答

在计算规范变量时,我使用了受限三次样条展开。您正在向分析中添加非线性基函数,就像添加新特征一样。这导致非线性主成分分析。有关示例,请参见 RHmisc的功能。transcanRhomals更进一步。

CCA 的标准方法使用乘积矩相关系数矩阵。对于最大幅度 CC,它通过两个矩阵(具有 n 行和 m1 和 m2 变量)的线性组合构造两个复合变量 z1(n) 和 z2(n),使得 abs(correlation(z1,z2)) 最大化。即使相关性(z1,z2)不是乘积矩而是定义不同,这个目标函数也可以直接最大化。

Mishra, SK (2009) “关于两组排名分数的序数典型相关分析的注释”

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319