我们有 10000 行ages (float), titles (enum/int), scores (float)
. 如何选择 1000 个最不同的行?我寻找一种适用于不止一种情况的通用解决方案。
我所说的不同是什么意思:
- 我们在一个表中有 N 列,每列都有 int/float 值。
- 您可以将其想象为 ND 空间中的点
- 我们想要选择彼此之间的距离最大化的 K 个点。
因此,如果我们在一个紧密排列的簇中有 100 个点,并且在距离上有一个点,我们会得到这样的三点:
或者这个
它看起来像一个具有给定分辨率但不适用于 3d 点的 ND 点云“三角剖分”......那么如何从 N (具有任何复杂性)中选择 K 最远的行(点)?