不需联网也能进行OCR识别, iOS OCR神器 “深度识别”

“深度识别”是笔者独立开发和运营的一款OCR文字识别类app。自从2016年底上线以后，经历了多个版本的迭代，目前iphone平台累计下载已经超过20万次。截止笔者发稿时，深度识别在app store中国区的排名一般稳定在工具免费榜top 1000，工具畅销榜top 200以内。目前官网地址为

http://www.deep-ocr.org/

闲话少说，给大家介绍一下这款比较小众的OCR类app有哪些特色吧。

离线识别文字，多种方式导入图片

作为一个OCR文字识别类的app，深度识别的主打功能当然也就是识别图片中的文字。

目前市面上绝大部分文字识别类app都是采用百度提供的OCR识别API接口，虽然准确度不错，但是毕竟会受到网络环境的影响。如果没有Wi-Fi的话app立扑。“深度识别”采用笔者DIY的OCR识别引擎进行本地识别，即使在没有网络的情况下也能识别绝大部分场景下的中文文字。这样也就不用担心网速过低甚至断网影响识别的情况。

深度识别允许多种方式导入待识别图片。目前包括拍照，从相册导入图片以及从Wi-Fi共享导入图片。

选择不规则文字区域并矫正

由于各种原因，需要识别的图片有可能有一定的倾斜和扭曲，文字的分布也不一定规则，所以很多时候标准矩形框不一定能框选出文字区域。深度识别允许框选不规则的文字区域，比如下图中一个近似梯形的文字区域，再点击“剪裁”，需要识别的包含有文字的图片区域就被剪裁出来了；同时图片被调整为标准的矩形图片，更方便识别和查看。

文字校对，导出和保存

识别完毕以后，用户可以方便地比对原图片和识别结果进行校对。如果开通了内购，识别结果文字就可以通过iphone自带的标准共享方式导出到各种地方。可以（1）直接Wi-Fi传输（2）导出到其他app（3）拷贝或者存储到“文件”

通过Wi-Fi共享文件，方便PC和iPhone互传文件

深度识别提供了多种方式在手机和电脑间共享文件。对于拥有mac本子的用户，可以直接使用Wi-Fi在iPhone和mac笔记本间共享文件。对于非mac用户，可以使用app自带的局域网共享文件功能来上传或者下载文件。点击“启动文件共享”后，app就会自动成为一个小型的http服务器；用户可以通过浏览器访问自动生成的IP地址，从iPhone上传文件到iPhone端或者从iPhone下载文件到PC端。

制作PDF文档，满足多样化的办公需求

除了OCR文字识别，深度识别还有一项附加的功能——可以把图片转换为PDF文件，更贴近实际的办公需求。

结语

笔者全职开发“深度识别”到现在已经2年大半了。2015年中旬开始全职独立开发，2016年12月份上线1.0版本，之后又迭代了1年多更新至现在的4.5.0版本。主要是搞定可以离线识别中英混排文字的OCR引擎耗费了绝大部分的时间和精力（期间尝试了各种不同的算法，恍如炼丹），剩余的精力才能用来进行UI和其他功能的实现。作为一个独立开发者，也是要养家糊口的。目前app store上“深度识别”(点击此处下载)的下载价格为6元，内购分12元（导出120次识别结果）和25元（不限次数）两个档次。

目前主要精力还是开发和运营iPhone版的“深度识别”，安卓版的开发已经处于计划中，希望大家能够支持 -_- ||