就在前几天我的同事给我发来一份扫描版的 PDF,希望我能使用某种方法将里面的几页文字识别成可编辑的文本。我在使用了 扫描全能王、Scanbot 和 TextGrabber 等多款 OCR(光学文字识别)应用之后,觉得小嘿扫描是最高效的。我暂时并不认为小嘿扫描在多方面都优于其它几款知名的 OCR 工具,但在我所解决的需求场景中,它确实是最好最高效的。
因此我想先具体描述一下我的实际应用场景,再分析小嘿扫描的几个优势。你可能对它在整个流程体现出的优势都深有体会,也可能对其中某几个步骤感同身受。我所需要进行文字识别的文档是扫描版 PDF 的好几页文字,而且我得到的是电子版 PDF 而不是纸质。我首先使用 iOS 版的 PDF Expert 打开这个 PDF 文档,对目标页面进行批量截图,随后利用小嘿扫描进行批量的 OCR 操作,每识别完一页文字就用 AirDrop 把文本传输至 Mac,Mac 会得到文本文档,最后在 Mac 段端使用 Word 进行统一的编辑和调整。
以下是小嘿扫描在这些环节中体现出来的优势。
正确识别分段
小嘿扫描的第一个优势是对分段的正确处理。扫描全能王等应用会在一行文字的后面都加上一个换行符,本来文档里的一段话,经过 OCR 后就变成一行一段的文字,这在后续用 Word 处理调整时就有很多不便。如果你不太精通 Word 你可能会繁琐地手工删除多余的换行,如果你善于使用搜索引擎可能会知道在 Word 中可以采用将换行的标识符 ^p
替换为 空
来消除多余的换行。即使如此,多余的换行还是会带来其它可能的不便和繁琐。
小嘿扫描对分段的处理就特别好,原来文本中的一行就是一行,一段就是一段(可能也会有识别错误,但是非常少),你不需要花多一步的操作来解决一行一段问题以及可能存在的其它影响。
更适合批量操作
文字识别的基本流程是截取,OCR 识别,传输结果,编辑修改。对于多页文字的文字识别有两种方式,一是批量进行一个环节操作再批量进行下一个环节,二是完成一页识别的各个环节再进行下一页。这两种方式我认为前者的效率更高,因为后者可能需要在手机、文档和电脑之间频繁切换。
小嘿扫描在启动时默认读取相册而不是默认拍照,就对上述效率更高的批量操作很友好,这也是我喜欢小嘿扫描的重要原因。其它几款 OCR 应用基本上都是从上述提到的第二种识别方式来进行流程设计的,例如默认启动相机的扫描全能王、Scanbot 和 TextGrabber,它们打开相册中的截图都需要点击三次,而小嘿扫描只需要点一次!小嘿扫描在启动时会自动加载陈列相册图片,轻点就选中打开。
小嘿扫描另一个特性也使得它更适合批量操作。它会把每页文字的识别结果保存下来,在应用的「历史」页,你就可以选择多个结果一起复制,小嘿扫描会将这些文字按照照片的时间顺序自动合并拼接起来。这样,用小嘿扫描可以说完全能够将文字识别的各个环节隔离开,方便你批量进行操作。第一步完成所有的拍照或者截图,第二步高效识别每一页文字,第三步将所有文字合并复制,最后发送到电脑端统一在 Word 中进行整理。
尚佳的文字识别率
很难说这些 OCR 工具的文字识别率哪家高,因为对于使用相机拍照扫描后识别文字而言,拍摄角度、光线都会影响到识别质量。因此使用扫描得到的电子版 PDF 作为源文档能在很大程度上提高识别正确率,在这种情况下,我也对比了这几款应用的识别率,小嘿扫描非常幸运地胜出,也欢迎读者尝试使用其它文档进行识别后对比。
小嘿扫描的其它功能
小嘿扫描的其它特性还包括「选择文本块」,仅选择特定的几行文字而不是整页;另一个特性是「按住校对」,就像修图软件一样查看源文件和处理后文件的差异对比;还有「智能预览」,它能识别出文字中的电话、地址、快递单等常用的信息。
如果你在金融、法律等行业从业,可能常会遇到将扫描版 PDF 中的文字转移到到 Word 中这样的需求,小嘿扫描可能就是你需要的利器。就像我在文章中强调的,小嘿扫描可能不是最优秀的文字识别应用,但在某些细分场景下它能给你省下大量的操作和时间。你可以在 App Store 下载小嘿扫描,售价 6 元,现新品上架促销只需 3 元。
评论送码
你肯定使用过其它 OCR 工具,说说你用它们时遇到的问题,或是你希望小嘿扫描加入哪些可以提升使用体验的功能。
下周三(8月9 日)我们会从评论区抽 3 位赠送由开发者提供的小嘿扫描兑换码各一枚。
恭喜 Mr_Sandman、光风霁月、百度搜不到 各获得小嘿扫描兑换码一枚,请注意查收你们站内私信。