我想使用亲和力传播对我的文档向量(doc2vec)进行聚类。
但是,如果我应该使用余弦相似度或余弦距离来聚类我的文档向量,我只是感到困惑。目前,我正在使用余弦相似度进行亲和传播聚类。因此,我的第一个问题是;
使用余弦相似度对我的 doc2vec 文档向量进行聚类是否正确?
此外,我想使用 t-sne 可视化我的集群结果。但是,我看到 t-sne 需要距离矩阵作为输入。因此,我的第二个问题是;
对 t-sne 使用距离矩阵(余弦距离)是否正确,而我使用余弦相似度进行聚类?
如果需要我的代码,我也可以发布它。
请帮我。