我以为我知道协方差,但我开始认为还有更多。例如,当您将观测值乘以其相应的协方差矩阵时会发生什么?[x1,y1] * cov(x,y). 我做了一个小实验,对结果很感兴趣。
import matplotlib.pyplot as plt
import numpy as np
mean = [0, 0]
cov = [[1, 0.9], [0.9, 1]]
x, y = np.random.multivariate_normal(mean, cov, 1000).transpose()
plt.scatter(x, y)
plt.show()
new_x = []
new_y = []
for i in range(500):
vec = np.array([x[i],y[i]])
trsf = np.matmul(vec.transpose(),cov)
new_x.append(trsf[0])
new_y.append(trsf[1])
plt.scatter(new_x,new_y)
如您所见,每个 (x,y) 对都投影到一条没有任何偏差的线上。我很好奇到底发生了什么?我的猜测是(A)这些数据点被投影到 OLS 线上。或者 (B) 这些数据点被投影到协方差矩阵的前导特征向量上。
有什么想法/想法吗?



