我正在尝试了解 PCA,但我没有机器学习背景。我来自软件工程,但到目前为止我尝试阅读的文献对我来说很难消化。
据我了解PCA,它将从N维空间中获取一组数据点并将它们转换为M维空间,其中N> M。 我还不明白PCA的实际输出是什么。
例如,取这个 5 维输入数据,其值在 [0,10) 范围内:
// dimensions:
// a b c d e
[[ 4, 1, 2, 8, 8], // component 1
[ 3, 0, 2, 9, 8],
[ 4, 0, 0, 9, 1],
...
[ 7, 9, 1, 2, 3], // component 2
[ 9, 9, 0, 2, 7],
[ 7, 8, 1, 0, 0]]
我的假设是 PCA 可用于将数据从 5 维减少到 1 维。
数据详情:
数据中有两个“组件”。
- 一个组件具有中等
a水平、低水平b和c水平、高水平d和不确定e水平。 - 另一个组件具有高
a和b级别、低c和d级别以及不确定e级别。
这意味着这两个组件由 和 区分最大,由b和d稍微区分,并且a可以忽略不计。ce
输出?
我正在编造这个,但是说具有最高微分能力的(非归一化)线性组合类似于
5*a + 10*b + 0*c + 10*d + 0*e
沿该单轴转换的上述输入数据为:
[[110],
[105],
[110],
...etc
该线性组合(或描述它的向量)是 PCA 的输出吗?或者输出是实际减少的数据集?还是完全不同的东西?