数据挖掘 - 当你没有任何负集时，如何找到与正集相似的点？ - 吾爱随笔录

我习惯做的任务如下。一位客户带着一群客户（称为积极公司）来找我，他希望我找到其他类似的潜在客户。通常，他还会给我一组负面公司，而我有一大堆潜在公司（我称之为篮子）。

我通过做一个 Adaboost 分类器来执行这个任务，我用正面和负面进行训练。然后我在篮子上运行这个分类器。篮子中的每家公司都会获得一个分数，最高分代表客户最有希望的前景。

现在，一个新客户没有任何负面的东西可以给出，我有点迷路了。显然，我不能再进行监督学习了。我首先想到对每个正数执行k-最近邻，然后我会收到一个“接近”前景的列表。问题是我没有分数了。此外，使用 k-nearest 方法，我应该定义一个我不喜欢的距离，因为我不想给特征赋予主观权重。事实上，Adaboost 分类器会学习一些权重，并且自己会预测哪些特征是重要的。

有人可以告诉我如何解决这个问题吗？