我熟悉 kmeans 来聚类数据点,但不熟悉文本。所以我有一列 cvs 格式的单词,我想对那些具有相似或更多单词的单词进行聚类,然后将这些簇映射到数字作为索引,这些索引号需要添加为第二列。我知道 python 中有 scipy packahes 和 word2vec,但这是我第一次处理聚类文本。关于如何做到这一点的任何想法?
在 Python 中聚类相似的单词并映射到数字
计算科学
Python
映射策略
聚类
2021-12-15 14:36:28
0个回答
没有发现任何回复~
其它你可能感兴趣的问题