我正在尝试我的第一个关于机器学习的“项目”,但我有点卡住了。但是,我不确定这是否可能,但这是我的问题。
我想要实现的是根据用户在某个网站上的访问量对用户组进行聚类。所以我从这个特征矩阵开始:
USER abc.be abc.be/a abc.be/b xyz.be xyz.be/a
123 0 0 0 0 1
456 1 0 1 0 0
789 2 3 1 0 0
321 1 0 1 0 1
654 1 1 1 1 1
987 0 1 0 3 0
所以我在这个例子中得到了 5 个特性(我的 5 个不同的网站)。所以然后我使用 PCA 来获得二维,所以我可以绘制它并看看它是如何进行的。
我的特征矩阵(在我的例子中)是 5 列 * 6 行。
我的 PCA 矩阵是 2 列 * 6 行。
我来到了这个情节(请注意,这个情节使用的数据与示例不同,但想法是一样的)
绿色点是我的 PCA 点红色圆圈是我的 K-Means 质心。
但我正在努力解决的部分是:所以我得到了我的集群(红色圆圈),但我怎么能用它说:“看起来大多数用户都去站点 A 或站点 B)?
那么如何将我的集群耦合到我的特征矩阵中的特征标签?
或者如何解决这个问题?
任何帮助表示赞赏:)