仅使用正面标签学习

数据挖掘 机器学习 异常检测 k-nn
2021-09-23 05:24:40

我有大约 700 万行客户数据(大约 500 个稀疏属性)

其中有 100 万人选择了一项新服务。

如何使用此信号来预测剩余的哪些客户可能会采用该服务?以及如何衡量有效性?

目前面临的问题——

  1. 由于缺乏明确的负变量,无法将此视为监督问题
  2. 无法应用标签传播,因为只有一个类

除了将其视为异常检测问题(oneclasssvm 等)外,我还尝试使用基于最近邻的方法。

如果我缺少一些常用技术,请寻找其他方法来解决问题。

我知道这里有一个答案但它只谈论我已经尝试过的 oneclasssvm。还试图找到衡量模型有效性的方法以及任何新的解决方法。

1个回答

你感兴趣的话题被称为“PU 学习”或“积极和无标签的学习”。

您可以先查看 调查文献