大家好,欢迎来到IT知识分享网。
之前知道了一个概念,可以搜索的PDF,原来是叫双层PDF,通过将文本型文件和图片型文件复合,形成多层结构的PDF文件。现在有合同的Word版和盖章扫描版,我想实现对盖章扫描版的PDF实现搜索功能,应该怎么实现呢?
从网上找到的方法,是直接扫描的时候同时识别图片上的文本,生成双层PDF。无论扫描怎么清晰,识别准确率都不太可能是100%,这样去核对信息要花不少时间。那能不能有更节省时间的办法呢?
我尝试用ABBYY FineReader操作,发现识别文本的内容是可以复制粘贴的。这样的话,事情就变得简单了。软件识别盖章扫描版的文本后,我直接复制Word版的内容替换识别的文本,这样就可以保证100%的准确性了。
按照同样的思路,如果有现成的其他资料Word版和图片版PDF,都可以这样操作。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/86170.html