如何将数据分类为不匹配任何标签

数据挖掘 深度学习 神经网络 卷积神经网络 监督学习
2022-02-25 12:26:32

我正在创建一个受监督的卷积网络,它可以识别区域语言中的短语。

例如:

我有一个数据集,其中包含标签 A 的 100 个声音和标签 B 的另外 100 个声音。现在网络的正常操作是区分标签 A 和标签 B 之间的声音。

但是假设我给网络一个新的声音进行分类,它实际上既不是 A 也不是 B。我希望神经网络告诉我它不限定任何标签。

我怎样才能做到这一点?

1个回答

让我们换一种说法,分解成两个问题:

  1. 给定一个声音,我们想知道它是否属于 A 类
  2. 给定一个声音,我们想知道它是否属于 B 类

这种表达方式对某些技术很有价值,尤其是“一类分类”和“PU 学习”(从正面和未标记的示例中学习)。当您想知道“我的物品是否遵循给定的分布 D?”时,这些技术非常相关,这正是您要寻找的。

尽管如此,如果您拥有(或可以收集)大量既不是 A 也不是 B 的数据,您可以简单地将其标记为垃圾类 C 并使用通用分类器 - 但是,它实际上可能是有害的,因为您可能假设 C 类有错误[Li、Liu 和 Ng,“Negative Training Data can be Harmful to Text Classification”,2010]。可以工作并且开发起来更简单,根据您的情况可能已经足够好了。