我试图了解如何使用互相关来确定两个信号的相似性。本教程对基础知识提供了非常清晰的解释,但我仍然不明白如何有效地使用归一化来防止强信号在具有不同能级的信号时主导互相关测量。同一位导师 David Dorran在这里讨论了归一化的问题,并解释了如何使用点积对相关性进行归一化,但我仍然有一些疑问。
我编写了这个 python 例程来在一组信号中的每对信号之间进行互相关:
import numpy as np
import pandas as pd
def mycorrelate2d(df, normalized=False):
# initialize cross correlation matrix with zeros
ccm = np.zeros(shape=df.shape, dtype=list)
for i, row_dict1 in enumerate(
df.to_dict(orient='records')):
outer_row = list(row_dict1.values())
for j, row_dict2 in enumerate(
df.to_dict(orient='records')):
inner_row = list(row_dict2.values())
x = np.correlate(inner_row, outer_row)
if normalized:
n = np.dot(inner_row, outer_row)
x = x / n
ccm[i][j] = x
return ccm
假设我有 3 个幅度增加的信号:[1, 2, 3], [4, 5, 6] 和 [7, 8, 9]
我想交叉关联这三个信号以查看哪些信号对是相似的,但是当我将这三个信号传递到我编写的例程中时,我似乎没有得到相似度的度量。互相关值的大小只是能量信号的函数。时期。甚至一个信号与其自身的互相关产生的值也低于同一信号与另一个更高能量信号的互相关。
df_x3 = pd.DataFrame(
np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]).reshape(3, -1))
mycorrelate2d(df_x3)
这产生:
array([[array([ 3, 8, 14, 8, 3]),
array([12, 23, 32, 17, 6]),
array([21, 38, 50, 26, 9])],
[array([ 6, 17, 32, 23, 12]),
array([24, 50, 77, 50, 24]),
array([ 42, 83, 122, 77, 36])],
[array([ 9, 26, 50, 38, 21]),
array([ 36, 77, 122, 83, 42]),
array([ 63, 128, 194, 128, 63])]], dtype=object)
现在,我传入相同的 3 个信号,但这次我表示我想要标准化结果:
mycorrelate2d(df_x3, normalized=True)
这产生:
array([[array([ 0.2142, 0.5714, 1., 0.5714, 0.2142]),
array([ 0.375, 0.71875, 1., 0.5312, 0.1875]),
array([ 0.42, 0.76, 1., 0.52, 0.18])],
[array([ 0.1875, 0.5312, 1., 0.7187, 0.375]),
array([ 0.3116, 0.6493, 1., 0.6493, 0.3116]),
array([ 0.3442, 0.6803, 1., 0.6311, 0.2950])],
[array([ 0.18, 0.52, 1., 0.76, 0.42]),
array([ 0.2950, 0.6311, 1., 0.6803, 0.3442]),
array([ 0.3247, 0.6597, 1., 0.6597, 0.3247])]],
dtype=object)
现在所有的最大值都是 1!!因此,我们从具有基于虚假差异的最大值变为完全没有最大值之间的差异!我欣然承认,我不明白如何使用互相关来检测信号之间的相似性。某人将信号与互相关进行比较的分析工作流程是什么?