ngram 和 RNN 预测率 wrt 词索引

数据挖掘 神经网络 nlp 统计数据 rnn ngram
2021-09-22 04:46:13

我试图绘制与单词在句子中的位置相关的正确预测率(对于前 1 个候选名单): 在此处输入图像描述

我期待在 ngram 设置上尽快看到一个平台,因为它是不必要的上下文。然而,我没想到的一件事是预测率下降了。据我了解,由于我们已经有了 3 个单词的上下文,因此高原应该渐近收敛到最高值。但是循环网络和 Ngram 模型都在经历这种下降。我不知道为什么会这样。

(注意 RNNLM 是用于构建循环神经网络的框架名称,它使用 500 个神经元和 100M 直接连接,RNN25 是相同的设置,但训练基数除以 for)

这是句子大小分布: 在此处输入图像描述

提前致谢。

1个回答

循环神经网络 (RNN) 随着时间的推移创建单个状态向量。因此,该曲线是可以预期的。最初,状态向量确实有足够的信息来进行质量预测。然后很快达到渐近性能。总体而言,预测的正确率在 15% 到 22% 之间。

图的形状可能是训练语料库中句子长度的函数。句子的长度可能在 3 到 7 个单词之间。下降可能是因为较长句子的训练数据较少。