在需要大量数据的复杂模型的情况下,如何使用主动学习?

人工智能 机器学习 循环神经网络 主动学习
2021-10-27 18:21:31

我们有一系列数据,我们想标记每个系列的部分。由于我们没有任何训练数据,我们可以尝试使用主动学习作为解决方案,但问题是我们的分类器类似于 RNN,需要大量数据进行训练。因此,我们在快速收敛以仅标记未标记数据的比例小部分方面存在问题。

有没有关于这个问题的文章(主动学习和一些复杂的分类器,比如 RNN)?

这个问题有没有好的解决方案?(因为数据是一系列动作)

2个回答

正如我发现这个案例回到了序列标签序列标注有一些经典的解决方案,例如条件随机场(CRFs)和隐马尔可夫模型(HMM)。此外,在主动学习 (AL) 中有一些使用算法的解决方案,例如 struct SVM (SVMstrcut) 喜欢这篇论文

此外,主动学习中的一些 NLP 解决方案可以帮助解决这类问题,例如这篇关于命名实体识别 (NER) 中的主动学习的论文。

此外,主动学习与深度网络(如 CNN)的结合发生了。例如,本文对这个想法进行了更多解释。

您还可以查看这篇论文,其中讨论了 LSTM 和 GRU 与主动学习和词嵌入 (word2vec) 的使用。