使用 AIC/BIC 进行肘部测试,使用 GMM 识别集群数量

机器算法验证 聚类 aic 比克 广义矩
2022-03-25 03:48:41

在此处输入图像描述

当肘部测试(AIC/BIC vs n_components)产生这样的图表时,如何使用 GMM 选择集群数量?

1个回答

欢迎来到简历!

该图显示了 AIC 和 BIC 如何随集群数量的变化而变化。虽然 AIC 随着集群数量的增加而持续下降,但您可以看到 BIC 在集群后停止下降。因此,您可以选择k=6k=6

另一种选择“最佳”聚类数量的方法是考虑图形的肘部。函数的肘部是一个点,在该点之后减少变得明显更小。肘部是一种启发式方法,因此没有确切的方法来确定哪个值最能描述这一点。例如,有人可能会争辩说 AIC 和 BIC 在集群之后都停止下降,而其他人可能会争辩说这是在集群之后。您甚至可以争辩说,最大的下降已经发生在集群之后。k=5k=6k=2

最后,您不必仅仅因为 AIC/BIC/建议您这样做而选择任何数量的集群。如果您有一些先验理由假设应该有集群,那么这可能是一个更好的选择。k=3

简而言之:如果您没有其他理由假设一定数量的集群,那么在这种情况下,肘部是确定集群数量的启发式指南。