乌克兰开发商 Readdle 最近可以说是动作频频,除了上线老牌日历应用 Calendars 的 macOS 版本,接着又发布了 macOS 平台知名 PDF 编辑器 PDF Expert 的大版本更新。在 3.0 版本中,PDF Expert 推出了 OCR 识别、格式转换、扫描智能优化等功能,朝着专业化 PDF 编辑器的目标又前进了一步。

难得的是,PDF Expert 3.0 新增的这些功能并不是滥竽充数,这段时间我使用下来后惊奇地发现效果远超预期,就算是中文用户也能正常地使用这些功能。

真正好用的 OCR 识别功能

PDF 格式的文件包罗万象,可以由各种各样其它格式的文件转换而来,而源文件基本上就决定了转换后的 PDF 文件是否可以直接使用里面的文本内容。比如说,将 DOC 文件转换为 PDF 文件,文本内容可以直接使用;将 JPG 文件转换为 PDF 文件,则文本内容无法直接使用。

在PDF 文件中的文本内容无法直接使用的情况下,我们就需要用到 OCR 技术来识别这些文本内容。有不少 App 也内置了 OCR 功能,但它们大多不是识别率堪忧,就是对中文的支持不好,抑或是像 Acrobat Pro 一样价格昂贵。

Readdle 在 PDF Expert 上非常聪明地采用了 Apple 的 Apple Vision 框架,在降低跨平台适配成本的基础上又保证了识别率和对多语言的支持。另外,Readdle 还通过机器学习技术来识别文档中的不同字体,就算是手写字迹也有不错的识别成功率。

在不手动启用 OCR 识别功能的情况下,使用 PDF Expert 就可以直接高亮或者复制扫描版 PDF 文件中的文本。不过,在测试的过程中我发现部分扫描版 PDF 文件无法选中文本,不清楚是否是新版本的 Bug。

Image.png

如果想获得整页 PDF 文档或者整个 PDF 文档的文本内容,那么可以在工具栏中选择「扫描与识别」>「识别文字」,OCR 完成后 PDF Expert 会直接在原来扫描版的文字上面使用识别后的文字覆盖。在这里可以发现 PDF Expert 中 OCR 功能的第一个优点,那就是可以保留原文档的排版格式。

Image.png

PDF Expert 中 OCR 功能的第二个优点就是支持多种语言,包括了简体中文和繁体中文,且识别率相当不错。

截屏2022-07-03 15.43.24.png

而第三个优点是 PDF Expert 支持对 OCR 识别后的文档进行单独纠正,点击文档中任意一个划分好的区块,就可以看到这部分的原图(扫描版文字),如果识别结果错误,那么可以直接在输入框中输入正确的结果,文档中显示的文本也会随之改正过来。

Image.png

方便实用的格式转换

我们在使用 Word、WPS 等文本编辑器或者 Ulysses、iA Writer 等 Markdown 编辑器时,都可以将文档导出为各种各样的格式,而这样的基础就是源文件的内容可以直接被读写编辑。在 PDF 阅读器上,如果想要把 PDF 文件转换成其它格式的文件就困难很多,比如说把 .pdf 格式转换成 .doc 格式或者 .xls 格式。

借助于 OCR 技术,PDF Expert 把格式转换功能变得非常简单。只需要在「文件」>「导出到」中选择任意一种格式,PDF Expert 就会把当前的 PDF 文档转换为指定的文件格式,并且还能保留原来的排版格式。

Image.png

我测试了 Word 文档、Excel 表单、富文本格式等几种较为复杂的格式,转换的效果基本令人满意。其中,PDF 文件转换为 Excel 表单后数据会自动填入单元格中。

如果是 PDF 文件转换为 Word 文档,那么源文件会被保留,识别好的文本内容会直接覆盖在源文件上,划词选择后可以直接使用。

智能的扫描提升

我们阅读的 PDF 文档很多都是通过扫描得来的,但是扫描质量参差不齐,导致阅读体验差强人意。PDF Expert 在新版本中新增的扫描提升功能可以帮助我们优化扫描质量,通过增强扫描、拆分页面、裁剪页面、清除空白边等功能来提升扫描文档的可读性。

增强扫描包含了彩色过滤、移除失真、设置页面大小这 3 个选项,启用增强后可以更改扫描图像的对比度、扭曲度和页面大小,让画面看起来更加清晰和端正。

Image.png

清除空白边这个功能的实际效果和它的名称不太一致,其实它是用纯色来填充页面的 4 个页边,方便写标记或者提升整个版面的美观度。

截屏2022-07-03 19.30.49.png

拆分页面这个功能也非常实用,如果我们扫描文件或者书籍的时候是左右两页同时扫描,那么这个功能可以帮助我们自动识别中缝并拆分成两个独立的页面。

总结

在 3.0 版本中,PDF Expert for Mac 还优化了整个界面的布局,使用了更好看的工具图标,工具栏的高度在调整后也更易点击。目前,PDF Expert 提供了文本标注、PDF 合并、填表、签字、编辑内容(文字、图片和链接)、编辑文档(重新排列、旋转、提取)等丰富的功能,再加上新版本中围绕 OCR 技术推出的三个新功能,PDF Expert 基本上可以满足我们在 Mac 上对于 PDF 文件的所有操作需求。

自从 PDF Expert 面世以来,我就一直将其作为主力 PDF 阅读器,如果你还没有尝试过这个 App,我推荐你要不妨趁着新版本推出的机会试试看。

在 macOS 版本更新到 3.0 之后,PDF Expert 采用了全新的定价策略。首先,如果你想要在 iPhone、iPad、Mac 三个设备上使用 PDF Expert 的全部功能,那么订阅的价格为每年 79.99 美元;如果你只想使用 macOS 版本,那么可以一次性支付 139.99 美元买断;新版本推出之后,老用户可以继续使用之前购买版本的所有功能,如果想要使用 OCR 识别、格式转换等新功能,那么第一年付费订阅可以获得 5 折的优惠,教育工作者和学生也可以在官网申请获得 5 折优惠。

 

> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀