如何计算基于聚类的核主成分分析的核矩阵 K?

数据挖掘 机器学习 深度学习 数据挖掘 大数据 主成分分析
2022-02-11 04:44:43

在实践中,一个大的数据集会导致一个大的 K,存储 K 可能会成为一个问题。解决此问题的一种方法是对数据集执行聚类,并使用这些聚类的方法填充内核以加速和减少存储。如何使用聚类计算内核?

1个回答

首先,我们必须了解什么是clustering.

它是一种无监督算法,适用于目标类未知的场景。所以本质上它是一种数据预处理算法。继续,cluster analysis,有助于检测patterns数据。现在,要检测数据中的模式,必须确保samplestatistically significant变量组成。为了找到如此重要的变量,我们需要执行各种数据预处理任务,如outliermissing value('s)correlationdimensionality reduction检测和处理。发布,执行这些步骤,noise将从数据中删除,并且可以显示signal. 否则,可以执行principal component analysis (pca)检测信号。然后,此信号可以帮助确定真实模式或clusters数据。

现在,进入问题的第二部分。您可以使用kernlab包中的R来计算内核。也许这些帖子可以进一步帮助您,1 , 2 , 3 , 4