我想知道如何评估可变长序列到序列的预测?假设我有以下和
我是否应该使用二进制比较,其中任何不匹配都计为 0,而任何完全匹配都计为 1?还是应该通过逐字符比较来计算常规精度?
我在这里担心的是,一方面,如果这是一个数字预测,那么任何数字不匹配都会破坏整个数字,所以不匹配在哪里并不重要;另一方面,为了找到改进训练集的方法,哪些数字往往会被错误计算,这将是一件好事。
另外:该任务是一个数字 OCR,因此 - 与可以容忍轻微误译的机器翻译工作相比 - 任何数字不匹配都可能导致严重的业务问题(例如不同的发票金额)。此外,我想知道哪些个别数字更容易被误读,所以我也需要一种方法来获得这种统计数据。