有无限数量的分类器吗?

机器算法验证 分类 定义
2022-04-03 13:18:48

我正在写一些关于时间序列分类的东西,并写了以下内容:

分类器是一个函数,对于给定的输入(在这种情况下表示存储在音频文件中的数据)返回,其中是有限的一组类(如)。x1,...,xnyC={c1,...,ck}C{M,F}

但后来我意识到这可能不是真的。但是,我想不出任何具有无限可能类的分类器示例。它们存在吗?如果是这样,有哪些例子?

3个回答

根据您的定义,应该可以有无限数量的类。

考虑分类规则的一种方法是将特征空间划分为段。因此,如果我们将一维特征空间作为输入,我们可以想象一个分类器内的任何输入 ”类。所以它会 ”,为等返回x1Rk[(k1):k)1[0:1)2[1:2)

这样的“模型”不是从任何数据中估计出来的,而是一个分类规则。

但在实践中,可能不可能有一个具有无限数量样本的分类器,因为任何数据集都是有限的。然而,我们可以想象一个“在线”分类器随着新样本的进入而重新调整。原则上新样本可以是一个尚未见过的类别。因此,类的数量可以永远增加,而不是提前知道。

对图像进行分类以说明描绘了哪个整数将是一个具有可数无限类集的分类问题,但您还需要一个无限大的图像作为输入数据。将问题视为单一分类问题,而不是通过对数字进行分类并从组成部分构造答案来构建解决方案也是一种相当糟糕的解决方法(如果您这样做,您可能不需要无限数据集来训练它)。

我怀疑是否存在无限类的实际案例,因为我们的大脑相当有限,并且过着相当有限的生活(在时间和空间上),所以我们很少以有意义的方式遇到无限。

距离相关的中餐厅流程可以是一个例子。您可以将其视为一种聚类方法,其中根据数据自适应地选择聚类的数量。随着您添加更多数据点,集群的数量原则上可以无限制地增加。因此,可能存在无限数量的集群(或类),但对于任何有限数量的数据,只有有限数量的集群被占用。