系统发育因变量:方差分析?

机器算法验证 方差分析 系统发育
2022-02-26 11:31:17

我了解从系统发育数据中得出协方差矩阵,以使对于您要进行回归的两个变量。但是如果你有一个连续变量,你之前已经证明它依赖于系统发育和一个序数变量,会发生什么?后者是序数,我不确定如何将其与系统发育依赖性导致有偏差的测试统计的方式联系起来。cov(X,Y)=0

在您的连续变量上计算 Felsenstein 的系统发育独立对比并将其用于您的 ANOVA 是否有意义?

PIC 值为:

Cij=(XiXj)dij

其中物种物种在系统发育树上的成对距离。XiXi,XjXjdijij

2个回答

我建议的第一步是为每个序数类引入一个虚拟变量(请参阅https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta上的评论.edu/faculty/kunovich/Soci5304_Handouts/Topic%25208_Dummy%2520Variables.doc&cd=2&ved=0CCAQFjAB&usg=AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ&sig2=9hkDU6Y2mpKcGzBTIK8jog)并绘制来自虚拟变量回归分析的各自平均值。您还可以测试虚拟变量本身的趋势。如果事先(查看当前数据)有理由这样做,您还可以根据虚拟变量的相应估计大小重新排序序数变量类别以进行后续分析。

假设先前的分析缺少增加的趋势效应(不一定是线性的)并在序数变量本身中加入任何可支持的排序,一个有趣的方法也解决了可能的正态性问题,是执行回归分析,其中所有变量都被分配等级,包括序数变量。这种疯狂的理由,引用维基百科关于斯皮尔曼的等级相关系数(链接:http ://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

“与任何相关性计算一样,Spearman 系数适用于连续变量和离散变量,包括序数变量。[1][2]”

Wikipedia 提供了一个示例和几种方法来评估计算的等级相关性的标准误差以进行测试。请注意,如果它在统计上与零没有差异,那么缩放版本(如基于等级的计算回归)同样不显着。

我将进一步规范化这些等级(除以观察次数),给出可能的样本分位数解释(注意,在构建相关数据的经验分布时可能会有所改进)。我还将在 y 和给定的转换后的序数变量之间执行简单的相关性,以便您选择的排名的方向(例如,1 到 4 与 4 到 1)产生在上下文中具有直观意义的排名相关性的符号你的学习。

[编辑] 请注意,ANOVA 模型可以使用适当的设计矩阵以回归格式呈现,并且无论您研究什么标准回归模型,中心主题是对给定 X 的 Y 进行基于均值的分析。但是,在某些学科(如生态学)中,对不同分位数(包括中位数)隐含的回归关系的不同关注已证明是卓有成效的。显然,在生态学中,平均效应可能很小,但在其他分位数上不一定如此。该字段称为分位数回归。我建议您使用它来补充您当前的分析。作为参考,您可能会发现 SAS 研究所的 Colin(Lin) Chen 撰写的论文 213-30“分位数回归和 QUANTREG 过程简介”很有帮助。

这里还有一个关于使用秩变换的资料:Ronald L. Iman 和 WJ Conover 的“回归中使用秩变换”,发表在 Technometrics,第 21 卷,第 4 期,1979 年 11 月。文章指出回归使用秩变换似乎在单调数据上效果很好。可靠性专业人士也分享了这一观点,他们在在线杂志上引用:“秩回归估计方法非常适合可以线性化的函数”。资料来源:“可靠性热线,第 10 期,2010 年 12 月。

Garland 等人开发了系统发育 ANOVA 测试。(1993),并在包中的phy.anova函数中实现。geiger该方法通过基于模拟系统发育的进化生成零分布来生成针对系统发育非独立性校正的 p 值。