聚类分析的最大问题之一是,当基于所使用的不同聚类方法(包括层次聚类中的不同链接方法)时,我们可能不得不得出不同的结论。
我想知道您对此的看法——您将选择哪种方法以及如何选择。有人可能会说“最好的聚类方法是给你正确的答案”;但我可能会质疑聚类分析应该是一种无监督的技术——那么我怎么知道哪种方法或联系是正确的答案呢?
一般来说:单独的集群是否足够强大,可以依赖?或者我们需要第二种方法并获得基于两者的共享结果?
我的问题不仅是关于验证/评估聚类性能的可能方法,而且更广泛 -我们在什么基础上选择/偏好一种聚类方法/算法而不是另一种聚类方法/算法。此外,当我们选择一种方法来对我们的数据进行聚类时,是否有常见的警告我们应该环顾四周?
我知道这是一个非常笼统的问题,很难回答。我只想知道您是否有任何意见或建议或任何建议让我了解更多相关信息。