如何从对人们感兴趣的领域的调查中解释这个 PCA 双图?

机器算法验证 主成分分析 解释 民意调查 李克特 双标图
2022-03-28 00:48:37

背景:在我的调查中,我向数百名参与者询问了他们对选定领域的兴趣程度(采用五点李克特量表,1 表示“不感兴趣”,5 表示“感兴趣”)。

然后我尝试了 PCA。下图是前两个主要成分的投影。颜色用于性别,PCA 箭头是原始变量(即兴趣)。

我注意到:

  • 点(受访者)被第二个组件很好地分开。
  • 没有留下任何箭头。
  • 有些箭头比其他箭头短得多。
  • 变量往往会形成集群,而不是观察。
  • 似乎向下(指向男性)的箭头主要是男性的兴趣,而向上的箭头主要是女性的兴趣。
  • 有些箭头既不向下也不向上。

问题:如何正确解释点(受访者)、颜色(性别)和箭头(变量)之间的关系?从这个情节中可以挖掘出关于受访者及其兴趣的其他哪些结论?

数据可以在这里找到。

PCA分析

1个回答

点是受访者,颜色是性别。这个,你知道的。您绘图的主轴代表第一个和第二个 PC 分数,并在此基础上绘制个人。左下象限的某个人在这两个方面都得分低。PC2 似乎标记了“男性”和“女性”的兴趣。我不知道 PC1 是什么意思,但它可能代表了一个整体的兴趣得分——有很多兴趣的人得分高。或者它可能代表有强烈兴趣的人(5 分)。

向量是原始变量的投影坐标系。因此,如果你将一个点垂直投影到阅读向量上——你应该得到那个人的阅读分数。相对位置在这里很重要。

以“肾上腺素运动”之类的“男性”向量为例。现在想象你从右上象限的高处投射一个粉红色的点。该人对“肾上腺素运动”的坐标将是负面的。

那么为什么箭头都在图表的右半边呢?给定几何形状,一个人在图的左侧越深,他们的正数预测就越少。这表明 PC1 是衡量整体兴趣水平的指标。

我不确定你还能在这里学到什么。你可能想看看 PC3 和 PC4,如果 PC1 和 PC2 只告诉你有些人比其他人有更多的兴趣,并且男性与女性不同。

您的情节似乎几乎围绕 PC1 轴对称,并且关于性别对称。与女性对男性的兴趣一样多的男人对女性感兴趣……或者这是真的吗?我只是在看点。查看地图不对称的区域可能会很有趣:PC1 大,PC2 适度负向——该部门有很多活动。为什么?