数据挖掘 - 如何在数学上解释 PCA 的平移和旋转不变性 - 吾爱随笔录

我正在自学（不是学生）的课程有一个家庭作业问题，即：

让我们的 $n \times d$ 维数据向量表示为 $x_1,\ldots,x_n$ 然后让 $R$ 做一个 $d \times d$ 旋转矩阵。为简单起见，您可以假设 $x_t$ 的中心在 $0$ . 让

x_{t}^{'} = R x_{t} + v

$x_t' = Rx_t + v$ 在哪里

v

$v$ 是一些固定的翻译。形成第二个数据集。现在，对于任何

K

$K$ 我们挑选，让我们对两个数据集分别使用 PCA 来获得

K

$K$ 维投影

y_{1}, \dots, y_{n}

$y_1,\ldots ,y_n$ 和

y_{1}^{'}, \dots, y_{n}^{'}

$y_1',\ldots,y_n'$ ，分别。

写下两个 PCA 投影矩阵之间的关系 $W$ 和 $W'$ 就旋转矩阵而言 $R$ 和翻译向量 $v$ . 从数学上解释你是如何得出这个答案的。

我的回答基本上是，对于未转换的数据集，我们有 $W$ 是顶部 $k$ 的特征向量 $S[\mu] (S[\mu]$ 是未转换数据集的协方差矩阵，以 $\mu (\mu$ 是 $0$ 对于未转换的数据集）） $W'$ 将是顶部 $k$ 矩阵的特征向量 $(R^T) \times S[R^T(\mu-v)] R$ . ( $R^T$ 是 $R$ 转置）。我通过在协方差矩阵的定义中应用变换来做到这一点 $S'$ 找到之间的关系 $S'$ 和 $S$ .

该问题的目标是显示 PCA 的旋转和平移不变性。任何人都可以对此做出解释吗？