我刚从计算机科学专业毕业,具有非常理论的背景,但没有任何数据科学或人工智能经验,我自己努力探索这两个领域。更准确地说,我尝试研究一种类似于 k-means 的玩具子空间聚类算法,并且我认为我成功地学习了基本的优化技术。
所以现在我有一些临时子空间聚类算法,而且......我被卡住了。我如何验证它?在学习期间,我学习了很多形式证明或模型检查技术,但我觉得它们在这里完全无关紧要。我读了几篇 AI 论文,似乎在 Clustering 中有很强的实验验证传统,有很多有效性度量。我的问题是它们对我来说毫无意义。我不明白他们证明了什么,甚至为什么他们是相关的。如果可能的话,我会对关于实验验证方法的一般课程非常感兴趣(如果它真的是一件事!),如果可能的话,有理论依据。
此外,我真的不知道人们在聚类算法中寻找什么好的属性。我应该针对哪些一般定理?我知道这可能是一个与我正在研究的问题太相关的问题——对类似 k-means 的算法的通用答案就足够了。