我一直在研究使用点双列相关作为统计量来衡量二分变量和连续变量之间的关系。维基百科等。人。似乎同意点双列相关是皮尔逊相关的一个特例,但我找不到代数或其他方面的证明,这让我对在我正在做的研究中使用它持谨慎态度(我之后需要做一些统计置信度测试)。我自己也试过推导出真相,却把一切都绕了一圈。
非常感谢任何建议。
我一直在研究使用点双列相关作为统计量来衡量二分变量和连续变量之间的关系。维基百科等。人。似乎同意点双列相关是皮尔逊相关的一个特例,但我找不到代数或其他方面的证明,这让我对在我正在做的研究中使用它持谨慎态度(我之后需要做一些统计置信度测试)。我自己也试过推导出真相,却把一切都绕了一圈。
非常感谢任何建议。
设数据由对和对组成。它们的 Pearson 相关系数将与由对应的和对组成的反向数据相同。因为第一个坐标恰好有两个不同的值,所以反转数据的回归线必须通过均值点和,因此它具有斜率 . 相关系数是通过标准化得到的:它必须乘以第一个坐标的标准偏差并除以第二个坐标的标准偏差(原始值),写。个零和个零组成的事实来计算;它等于
因此,皮尔逊相关系数为
这正是点双列系数的维基百科公式。

红点的高度描绘了每个垂直点的平均值和。灰色虚线是回归线。