问题:
我有一个增量在线聚类算法,需要用户在执行前指定 4 个参数。如果选择“一个好的参数值”,该算法将给出“好的结果”,但没有办法事先知道最佳匹配的参数值是什么。例如,我们可以执行多次执行并在每次执行后评估结果,直到找到最佳参数值。但是,如果我们更改算法处理的数据集,我们需要再次确定该数据集的最佳参数值是什么。此外,在线算法应该处理不断到达和不断发展的数据流,即我们事先没有所有数据。
问题:
我的问题不在于在线聚类算法本身;我只是想知道是否有任何解决方案/方法可以在执行过程中自动调整参数值?在我的情况下,如何使用近似算法来调整参数值?我可以使用哪种近似算法以及如何(如有必要)调整它来解决这个问题?欢迎任何想法。