我有一些图像方面的经验,并且曾使用 CNN 进行图像分类,但在文本数据方面知识有限。
我当前要分类的输入写成:
hjkhghkgfghjkhghkgfghfefdefdcdefghjkjh-hjhgfe
fdcd-dd-fdc-dad-ad-dfe-cde-dggf-ghd-gg-bcd
hjkhghkgfghjkhghkgfghfefdefdcdefghjkjh-gh-gfed
dh-hg-gf-gh-dh-hg-gf-gh-hkhg-kh-hg-gf-gh-hkhg-kh-hg-gf-ghh-hgfg-dfd-dc-fgf-gh
我有超过 2000 行这些数据,需要分类。我知道对于常规文本数据,RNN 网络和 LSTM 单元已被认为不是非常有效。使用 RNN+LSTM 可以通过使用常用方法(例如词干提取、词根化、停用词过滤、标记化等)对数据进行预处理来获得良好的结果。但同样的方法不适用于我拥有的文本数据。
RNN 和 LSTM 还能处理我的数据吗?如果不是,你们建议我探索哪些网络来完成这样的任务?