基于流数据的分类器增量在线学习技术

机器算法验证 机器学习 分类 信号处理 在线算法
2022-03-14 05:44:53

哪些可能是面对这个抽象问题的好技术?

您有一个连续信号的数据流,作为来自物理传感器的数据流。该信号具有真实(离散)值,没有属性;可能会提取成瘾特征(例如,功率、自相关、熵)。您可以将有限集中的一个标签分配给信号的窗口。让这个标签成为训练标签。您必须选择窗口的起点和终点以及窗口标签。

任务是在线分类下一个窗口,就像接收到信号一样。

我要求一种增量算法,因为它应该在给定更多训练标签的情况下提高其检测性能。但即使只有一个训练标签,它也必须能够分类。

如果由于 windows 边界检测而导致问题变得太难,假设您可以将它们的大小固定为一个较小的常数。因此,该算法对信号的小片段进行分类,然后将具有相同标签的相邻片段合并。如果您使用这种简化的方法,请说明为什么它是合理的。

1个回答

如果这是一个二元分类问题,那么应该可以应用在线 SVM,例如Bordes, A. 和 Bottou, L.,“The Huller:一个简单而高效的在线 SVM”,ECML 2005

如果这是一个非二进制分类(即超过 2 个可能的标签),您可以查看内核递归最小二乘技术。它们是为在线回归而设计的,但它们在在线分类方面也表现得很好。这是一种基本的 KRLS 算法:Y. Engel、S. Mannor 和 R. Meir,“The Kernel Recusrive Least Squares Algorithm”,IEEE Trans. 信号处理,2004 年

这两种方法都需要固定的窗口大小来比较相同大小的输入向量。