如何解释稳定信号之间的低 Pearson 相关系数和不稳定信号之间的高 Pearson 相关系数?

数据挖掘 回归 相关性 皮尔逊相关系数
2022-03-02 14:22:43

我计算了两个信号之间的 Pearson 相关系数,它描述了单元的状态。在机组正常运行期间,两种信号都相当稳定,波动很小。在某个时间点,该单元开始形成缺陷,信号的振荡随之增加,并且开始观察到其绝对值的增长趋势。

  1. 描述设备正常运行的信号。
  2. 描述设备紧急操作的信号。
  3. 描述装置正常和紧急操作的信号(组合 1)和 2))。

在这三种情况下,我计算了信号之间的相关系数。在第一种情况下,最小值为 0.5,在第二种情况下,为 0.9,在第三种情况下,接近 1。

我有以下问题:

  1. 为什么在设备正常运行期间信号之间的相关性如此之低,而信号以相同的方式“通过眼睛”表现?事实上,此时的两个信号都具有最小的变化并且以相同的方式表现。

  2. 单元故障发生期间的高相关性。两种信号均呈上升趋势,再次表现出相同的“目测”。但是为什么在这种情况下相关性会变得很高呢?在正常运行期间,两个信号的表现也相同,稳定地保持在同一水平。

  3. 当我结合单元的正常和紧急信号时的最大相关性。为什么通过结合具有低(机组正常运行)和高(机组紧急运行)相关性的数据样本,我得到的样本之间的相关性竟然是所有三种情况中最高的?是什么导致了这种影响?

1个回答

“我们如何根据 Pearson 相关性确定关联强度?简单地说,Pearson(线性)相关性(r)不能按照您解释的方式来解释。它只是说明了两个变量之间的线性(常数)关系。它没有说明两个变量之间的因果关系。它是基于协方差的关联测度。另一种测度——称为皮尔逊(样本)相关系数测度,它基于距离。这种测度反映了因果关系。