我正在研究拼写检查器,我想创建一个拼写检查器,我对使用哪个模型感到困惑
- 字级建模
- 角色级建模
另外,我更喜欢神经网络而不是 Peter Norvig 或 N-gram/K-gram 或任何其他“Vanilla”算法,以便网络捕获上下文
示例:输入:我已申请信用卡 输出:我已申请信用卡
我已经完成了使用字符级 BLSTM 与噪声制造者/错误模型和注意机制但对结果不满意的模型。https://towardsdatascience.com/creating-a-spell-checker-with-tensorflow-d35b23939f60
我读过的一篇文章是使用 OpenNMT,但结果是灾难性的。https://medium.com/scribd-data-science-engineering/neural-spelling-corrections-and-the-importance-of-accuracy-977c0063d20f