我尝试使用 kmeans 算法将 227 行的数据帧聚集在 5 个集群中。每次我运行我的代码时,我都会得到不同的标签和不同的集群,这让我之后的分析有点棘手。
有人告诉我使用参数:randomstate 在我的结果中具有可重复性。我做到了。我有相同的集群,但仍然没有相同的标签。正常吗?有没有办法获得相同的标签?
在我的代码下方:
测试 sur 5 个集群
# Data
X = df.iloc[:,1:]
myseed = 10
# Modèle kmeans à 5 clusters
km = KMeans(n_clusters=5, random_state=myseed, n_init=30)
# Fitting du modèle aux points
km = km.fit(X)
y_km = km.predict(X)