我试图找到在平面中表示遗传距离的最佳方法,以便他们可以将它们用作规范冗余分析中的响应变量(使用rda()in vegan)。虽然无可否认有许多遗传距离可供选择,但它们都不是欧几里得,当我们使用 PCoA(原理坐标分析)“总结”它们时会产生负特征值。据我所知,有两个函数可以纠正负特征值:Lingoes 和 Cailliez。以下关于如何计算它们的解释是从包中函数的R文档中提取的,但它们在 中也得到了很好的解释:pcoa()PCNMape
Lingoes:在 Lingoes (1971) 程序中,将等于原始主坐标分析的最大负值绝对值的两倍的常数 c1 添加到距离矩阵中的每个原始平方距离,对角线值除外。对修改后的距离执行的新主坐标分析最多具有 (n-2) 个正特征值,至少 2 个空特征值,并且没有负特征值。
Cailliez:在 Cailliez (1983) 程序中,除对角线值外,将常数 c2 添加到距离矩阵中的原始距离。在 Legendre 和 Legendre (1998) 中描述了 c2 的计算。对修改后的距离执行的新主坐标分析最多具有 (n-2) 个正特征值,至少 2 个空特征值,并且没有负特征值。
在我的探索过程中,我在任何种群/景观遗传学文献中都没有遇到过这些转变。许多作者使用基于Fst的遗传距离,并倾向于在应用 PCoA 之前计算这些距离的平方根,然后删除任何剩余的负特征值(这些通常占小于 1% 的方差)。我也看到了Dps(共享等位基因距离的比例,或 Bray-Curtis 距离),但在社区组成研究中。事实上,这是CANOCO 5手册中推荐的程序(第 104 页)。
虽然我通常会在尝试一些默认文献似乎偏爱的东西后对此不屑一顾,但我在基于Fst的遗传距离矩阵上探索了所有这些转换,并且下游结果差异很大。sqrt()也就是说,当我使用 Cailliez 变换而不是在 PCoA 之前计算时,我的模型解释的遗传方差增加了大约 0.10 的调整后的 R2 。我的直觉告诉我不要走那条路,但我真的不确定为什么这些不同的校正会产生如此截然不同的结果,以及为什么我应该支持平方根校正。
感谢您提供的任何见解。