使用正样本和负样本训练带有字符串的 RNN

数据挖掘 机器学习 分类 神经网络 深度学习 rnn
2022-02-25 06:45:04

我正在尝试使用循环神经网络的正负样本来识别来自常规语言的字符串。

特别是,我尝试使用 Alex Graves 的rnnlib,但在更改网络架构以使网络适应我的需求时遇到了一些麻烦。

这是我的训练集的一个例子:

str1: w1 w2 ... wn --> label 1(它是该语言的有效字符串)

str2: w1 w2 ... wi --> label 0(不属于语言)

其中 wi 来自未知语言的字母表。

换句话说,我正在尝试将 RNN 用作二元分类器。

你能为这个任务推荐一个好的教程或参考吗?

提前致谢。

1个回答

我认为使用 Keras 在 Python 中使用 LSTM 递归神经网络进行序列分类是可用于此任务的最佳教程之一。它对 IMDB 数据集进行情感分析,是最容易理解的。此外,它使用了我现在使用的 Keras 框架,因为它很简单,并且提供在线支持和文档。keras 的 RNN 有多种选择,您可以根据自己的需求进行探索。此外,keras 使从各种选项中使用优化器变得非常容易。