与经典“手写”意义上的数字识别无关

上面的免责声明以避免这被视为重复。

我有 96 个序列号可供选择，另外还有 >220 个序列号可供选择。在较大的集合中通常存在较小的集合（尽管并非总是如此），但也有大约 120 个不正确的数字。

请参阅下面的示例 - 为了记录，我已尽我所能匹配......正确的数字是第一个，“可能”在右边的括号中：

21490（21490、21400、21498、21499、21480、21488）

21491（21401、21481、1401）

21492 (21492, 21402)

这组给出了我所看到的事物类型的一个很好的例子：

不限于 0、8 和 9，但这些是最差的，所以我想尝试了解哪些数字字符有问题（给它们都打分），并建立一个接受数字的模型，并且知道它可以是的数字列表，并给我它应该是什么数字，理想情况下带有置信度指标。

有人以前做过这个并且有任何想法吗？