我之前曾在手写记录上使用过 Tesseract CNN OCR,并对准确性感到惊讶。我想知道,是否可以使用它或其他方法来确定笔迹样本是否由同一个人书写?
我一直在寻找解决方案,但除了手写 OCR 识别之外,很难获得任何结果。有没有人尝试过这个或者可以指出我正确的方向?谢谢你。
我之前曾在手写记录上使用过 Tesseract CNN OCR,并对准确性感到惊讶。我想知道,是否可以使用它或其他方法来确定笔迹样本是否由同一个人书写?
我一直在寻找解决方案,但除了手写 OCR 识别之外,很难获得任何结果。有没有人尝试过这个或者可以指出我正确的方向?谢谢你。
这篇论文似乎完全符合您的要求:即使文本不匹配,也能识别笔迹样本的作者身份。
“ DeepWriter:一种用于文本无关作家识别的多流深度 CNN ” 邢林杰,于乔。2016 年。
由于书面内容的巨大差异和不同作家的写作风格模棱两可,独立于文本的作家识别具有挑战性。本文提出 DeepWriter,一种深度多流 CNN,用于学习用于识别作者的深度强大表示。DeepWriter 将本地手写补丁作为输入,并使用 softmax 分类损失进行训练。主要贡献有:1)我们为作家识别任务设计和优化了多流结构;2)我们引入数据增强学习来增强DeepWriter的性能;3)我们引入了一种补丁扫描策略来处理不同长度的文本图像。此外,我们发现英语和汉语等不同语言在作家识别方面可能具有共同特征,联合训练可以产生更好的性能。在 IAM 和 HWDB 数据集上的实验结果表明,我们的模型实现了很高的识别准确率:在 301 位作家和 657 位作家上,一个英文句子输入的识别准确率为 99.01%,在 300 个作家的一个汉字输入上的识别准确率为 93.85%,优于之前的方法大的边际。此外,我们的模型在仅输入 4 个英文字母的 301 位作者上获得了 98.01% 的准确率。
连体网络用于比较签名等内容;尝试将此方法扩展到笔迹分析似乎是合理的。一个挑战是,虽然签名有点像“邮票”,因为作者希望一遍又一遍地复制相同的符号,但两个手写样本可能不会写相同的单词和短语。因此,该项目的成败取决于神经网络能否识别出与文字不同的写作风格。
Jane Bromley、Isabelle Guyon、Yann LeCun、Eduard Sickinger 和 Roopak Shah。“使用‘连体’时间延迟神经网络进行签名验证。” AT&T 贝尔实验室。1994
本文描述了一种用于验证写在笔输入板上的签名的算法。该算法基于一种新颖的人工神经网络,称为“连体”神经网络。该网络由两个相同的子网络组成,它们的输出连接在一起。在训练期间,两个子网络从两个签名中提取特征,而连接神经元测量两个特征向量之间的距离。验证包括将提取的特征向量与签名者存储的特征向量进行比较。接受比所选阈值更接近此存储表示的签名,所有其他签名都被拒绝为伪造品。
另一种方法是使用三重损失和嵌入策略,例如在 FaceNet 中使用的策略。然后,您通过某种方式比较嵌入以确定两个图像是否具有相同或不同的作者。从不同角度和不同闪电条件下拍摄的面部的成功是有希望的,并且可能更适合匹配笔迹样本。
弗洛里安·施罗夫、德米特里·卡列尼琴科、詹姆斯·菲尔宾。“ FaceNet:人脸识别和聚类的统一嵌入”
尽管人脸识别领域最近取得了重大进展,但大规模有效地实施人脸验证和识别对当前方法提出了严峻挑战。在本文中,我们提出了一个名为 FaceNet 的系统,该系统直接学习从人脸图像到紧凑欧几里得空间的映射,其中距离直接对应于人脸相似度的度量。一旦产生了这个空间,就可以使用将 FaceNet 嵌入作为特征向量的标准技术轻松实现人脸识别、验证和聚类等任务。我们的方法使用经过训练的深度卷积网络直接优化嵌入本身,而不是像以前的深度学习方法那样使用中间瓶颈层。训练,我们使用使用新颖的在线三元组挖掘方法生成的大致对齐匹配/非匹配面块的三元组。我们的方法的好处是更高的表示效率:我们实现了最先进的人脸识别性能,每张人脸仅使用 128 字节。在广泛使用的野外标记人脸 (LFW) 数据集上,我们的系统达到了 99.63% 的新记录准确率。在 YouTube Faces DB 上,它达到了 95.12%。我们的系统在两个数据集上都将错误率与发布的最佳结果相比降低了 30%。我们还介绍了谐波嵌入的概念和谐波三元组损失,它们描述了相互兼容的不同版本的人脸嵌入(由不同的网络产生),并允许相互直接比较。我们的方法的好处是更高的表示效率:我们实现了最先进的人脸识别性能,每张人脸仅使用 128 字节。在广泛使用的野外标记人脸 (LFW) 数据集上,我们的系统达到了 99.63% 的新记录准确率。在 YouTube Faces DB 上,它达到了 95.12%。我们的系统在两个数据集上都将错误率与发布的最佳结果相比降低了 30%。我们还介绍了谐波嵌入的概念和谐波三元组损失,它们描述了相互兼容的不同版本的人脸嵌入(由不同的网络产生),并允许相互直接比较。我们的方法的好处是更高的表示效率:我们实现了最先进的人脸识别性能,每张人脸仅使用 128 字节。在广泛使用的野外标记人脸 (LFW) 数据集上,我们的系统达到了 99.63% 的新记录准确率。在 YouTube Faces DB 上,它达到了 95.12%。我们的系统在两个数据集上都将错误率与发布的最佳结果相比降低了 30%。我们还介绍了谐波嵌入的概念和谐波三元组损失,它们描述了相互兼容的不同版本的人脸嵌入(由不同的网络产生),并允许相互直接比较。我们的系统达到了 99.63% 的新记录准确率。在 YouTube Faces DB 上,它达到了 95.12%。我们的系统在两个数据集上都将错误率与发布的最佳结果相比降低了 30%。我们还介绍了谐波嵌入的概念和谐波三元组损失,它们描述了相互兼容的不同版本的人脸嵌入(由不同的网络产生),并允许相互直接比较。我们的系统达到了 99.63% 的新记录准确率。在 YouTube Faces DB 上,它达到了 95.12%。我们的系统在两个数据集上都将错误率与发布的最佳结果相比降低了 30%。我们还介绍了谐波嵌入的概念和谐波三元组损失,它们描述了相互兼容的不同版本的人脸嵌入(由不同的网络产生),并允许相互直接比较。