点双列相关的证明是皮尔逊相关的一个特例

机器算法验证 相关性 皮尔逊-r
2022-04-15 16:45:57

我一直在研究使用点双列相关作为统计量来衡量二分变量和连续变量之间的关系。维基百科等。人。似乎同意点双列相关是皮尔逊相关的一个特例,但我找不到代数或其他方面的证明,这让我对在我正在做的研究中使用它持谨慎态度(我之后需要做一些统计置信度测试)。我自己也试过推导出真相,却把一切都绕了一圈。

非常感谢任何建议。

1个回答

数据由对和对组成。它们的 Pearson 相关系数将与由对应的对组成的反向数据相同。因为第一个坐标恰好有两个不同的值,所以反转数据的回归线必须通过均值点,因此它具有斜率nn0>0 (x,0)n1>0 (x,1)(0,x)(1,x)(0,M0)(1,M1)(M1M0)/(10)=M1M0. 相关系数是通过标准化得到的:它必须乘以第一个坐标的标准偏差并除以第二个坐标的标准偏差(原始值),写个零和个零组成的事实来计算它等于xsnn0n1

n1n(1n1n)=n0n1n2.

因此,皮尔逊相关系数为

r=M1M0snn0n1n2,

这正是点双列系数的维基百科公式

图:x 与 y,显示线性回归线和平均点

红点的高度描绘了每个垂直点的平均值灰色虚线是回归线。M0M1