我正在对我的数据使用聚类。由于 DBSCAN 算法还会告诉我可以使用的集群的估计值,因此我使用了 DBSCAN。我已经尝试过eps=[0.123,1,2]and min_smaples=[2,10,...60]。下面代码中的 print satatement 打印 714,它等于数据样本(行)的数量。代码如下所示:
dbscan = DBSCAN(eps=1, min_samples = 4)
clusters = dbscan.fit_predict(df)
print(len(clusters))
plt.scatter(df.iloc[:, 0], df.iloc[:, 1], c=clusters, cmap="plasma")
plt.xlabel("Feature 0")
plt.ylabel("Feature 1")
一些不同min_samples的示例图如下所示:
上述图的参数在下面以相同的模式给出。
- EPS=1,MIN_SAMPLES=2,EPS=1,MIN_SAMPLES=10
- EPS=1,MIN_SAMPLES=20,EPS=1,MIN_SAMPLES=40
从聚类的角度来看,这些图对我来说都没有意义。由此,我不得不得出结论,我不能对给定数据使用聚类,或者我做错了。所以,我需要帮助来了解上述情节的奇怪外观。
任何帮助表示赞赏



