高度相关变量几乎不相关的和和差的参考

机器算法验证 相关性 多重共线性
2022-03-16 04:01:20

在我写的一篇论文中,我为随机变量建模X+YXY而不是XY有效解决出现的问题XY高度相关并且具有相等的方差(就像在我的应用程序中一样)。裁判要我给个参考。我可以很容易地证明这一点,但作为应用期刊,他们更喜欢参考简单的数学推导。

有人对合适的参考有任何建议吗?我认为 Tukey 的 EDA 书(1977 年)中有一些关于总和和差异的内容,但我找不到。

1个回答

我会参考 Seber GAF (1977) 线性回归分析。威利,纽约。定理 1.4。

这说cov(AX,BY)=Acov(X,Y)B.

A= (1 1) 和B= (1 -1) 和X=Y= 带有 X 和 Y 的向量。

请注意,要拥有cov(X+Y,XY)0,至关重要的是 X 和 Y 具有相似的方差。如果var(X)var(Y),cov(X+Y,XY)会很大。