几节课前我在课堂上了解了 PCA,通过深入挖掘这个迷人的概念,我了解了稀疏 PCA。
我想问,如果我没记错的话,这就是稀疏 PCA:在 PCA 中,如果你有数据点变量,您可以表示每个数据点应用 PCA 之前的维度空间。应用 PCA 后,您可以再次在相同的维度空间中表示它,但是,这一次,第一个主成分将包含最大的方差,第二个将包含第二个最大的方差方向,依此类推。所以你可以去掉最后几个主成分,因为它们不会造成大量的数据丢失,你可以压缩数据。对?
稀疏 PCA 正在选择主成分,以使这些成分在其矢量系数中包含较少的非零值。
这应该如何帮助您更好地解释数据?谁能举个例子?