unsup_df是一个DataFrame只有一列:review。
我想形成 2 个评论集群。一正一负。
from sklearn.cluster import KMeans
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(unsup_df)
num_clusters = 2
km = KMeans(n_clusters=num_clusters)
km.fit(tfidf_matrix)
clusters = km.labels_.tolist()
上面这段代码抛出了一个错误:
ValueError: n_samples=1 应该 >= n_clusters=2
在线上km.fit(tfidf_matrix)
