何时停止收集数据?

数据挖掘 数据挖掘 聚类 数据集 数据
2022-03-15 02:17:31

我开发了一个迭代过程,通过它可以批量收集数据。数据是预定义的 3D 空间中的点。我正在尝试根据我的数据在该 3D 空间中探索和定位集群。在收集了一些批次后,我可以找到并创建集群。不过,当我收集更多数据时,正在做一些小的改进,新的结果并不值得付出努力。如何判断一个新批次是否“值得”收藏?是否有一些指标可以用来衡量我拥有的批次“相似”的程度,或者新的随机批次是否会影响整个过程?

1个回答

量化每个批次的集群变化量。

如果变化小于阈值,则停止。