“深度识别”是笔者独立开发和运营的一款OCR文字识别类app。 自从2016年底上线以后,经历了多个版本的迭代,目前iphone平台累计下载已经超过20万次。截止笔者发稿时,深度识别在app store中国区的排名一般稳定在工具免费榜top 1000,工具畅销榜top 200以内。目前官网地址为

http://www.deep-ocr.org/

     闲话少说,给大家介绍一下这款比较小众的OCR类app有哪些特色吧。


   离线识别文字,多种方式导入图片

    作为一个OCR文字识别类的app,深度识别的主打功能当然也就是识别图片中的文字。

    目前市面上绝大部分文字识别类app都是采用百度提供的OCR识别API接口,虽然准确度不错,但是毕竟会受到网络环境的影响。如果没有Wi-Fi的话app立扑。“深度识别”采用笔者DIY的OCR识别引擎进行本地识别,即使在没有网络的情况下也能识别绝大部分场景下的中文文字。这样也就不用担心网速过低甚至断网影响识别的情况。

    深度识别允许多种方式导入待识别图片。目前包括拍照,从相册导入图片以及从Wi-Fi共享导入图片。

可用多种方式导入图片


   选择不规则文字区域并矫正

    由于各种原因,需要识别的图片有可能有一定的倾斜和扭曲,文字的分布也不一定规则,所以很多时候标准矩形框不一定能框选出文字区域。深度识别允许框选不规则的文字区域,比如下图中一个近似梯形的文字区域,再点击“剪裁”,需要识别的包含有文字的图片区域就被剪裁出来了;同时图片被调整为标准的矩形图片,更方便识别和查看。 

近似梯形的图像区域在剪裁后得到了矫正


    文字校对,导出和保存

     识别完毕以后,用户可以方便地比对原图片和识别结果进行校对。如果开通了内购,识别结果文字就可以通过iphone自带的标准共享方式导出到各种地方。可以(1)直接Wi-Fi传输(2)导出到其他app(3)拷贝或者存储到“文件”

校对和导出识别结果


    通过Wi-Fi共享文件,方便PC和iPhone互传文件

     深度识别提供了多种方式在手机和电脑间共享文件。对于拥有mac本子的用户,可以直接使用Wi-Fi在iPhone和mac笔记本间共享文件。对于非mac用户,可以使用app自带的局域网共享文件功能来上传或者下载文件。点击“启动文件共享”后,app就会自动成为一个小型的http服务器;用户可以通过浏览器访问自动生成的IP地址,从iPhone上传文件到iPhone端或者从iPhone下载文件到PC端。

左和右分别是关闭和开启Wi-Fi共享时的状态


   制作PDF文档,满足多样化的办公需求

    除了OCR文字识别,深度识别还有一项附加的功能——可以把图片转换为PDF文件,更贴近实际的办公需求。

制作PDF文件,并添加了一个简单的批注


   结语

    笔者全职开发“深度识别”到现在已经2年大半了。2015年中旬开始全职独立开发,2016年12月份上线1.0版本,之后又迭代了1年多更新至现在的4.5.0版本。主要是搞定可以离线识别中英混排文字的OCR引擎耗费了绝大部分的时间和精力(期间尝试了各种不同的算法,恍如炼丹),剩余的精力才能用来进行UI和其他功能的实现。作为一个独立开发者,也是要养家糊口的。目前app store上“深度识别”(点击此处下载)的下载价格为6元,内购分12元(导出120次识别结果)和25元(不限次数)两个档次。

     目前主要精力还是开发和运营iPhone版的“深度识别”,安卓版的开发已经处于计划中,希望大家能够支持 -_- ||