我是一名字体爱好者,常常自诩「人形自走中文字体识别仪」。2015 年,我开始在知乎、百度知道、贴吧等处回答字体识别类问题。2020 年,我在百度贴吧发了一个 贴子 ,专门帮忙各路网友识别中文字体,至今已有一千多回复。收到的问题越多,越觉得授人以鱼不如授人以渔。本文即由此产生,旨在帮助有需要的读者自助识别中文字体。

中文字体掠影

本文的「字体」指的是电脑字库。字体这个领域非常冷门,除了设计师和爱好者,鲜少有人在乎它,但它却如空气般无处不在。

很多人初次接触到这个概念应该是在 Microsoft Office 里「设置字体」的基本操作。Office 的字体菜单包含有宋体(中易宋体)、黑体(中易黑体)、华文行楷、华文新魏等几款经典中文字体。

Word 字体设置。截图自 Microsoft Word

笼统地说,这些字体的作用是把国家规定的标准规范汉字结构,像素级地规定成电脑所显示的图像。这一过程并非计算机的自动过程1,而是由字库厂商的设计师人力设计出的。

字体设计师齐立创写方正粗倩体样字。图自 方正粗倩体创作过程
字体设计师齐立根据手绘草稿,计算机辅助设计方正粗倩体样字。图自 方正粗倩体创作过程

一款字体包含的汉字数量最少是由 GB2312(中国国家标准总局,1981)规定的 6763 字,早期字体很多按照此字表开发,故有「GB2312」的后缀。微软在此基础上扩充至 21003 字,称为「GBK」。2000年,国家质量技术监督局发布最新字符集 GB18030,收录汉字 70244 个。

近年来,方正字库、汉仪字库等老牌厂商和造字工房、喜鹊造字等字坛新秀推出了大量中文字体,我们电脑和手机上的字体选择已远远不止 Office 显示的那几种了。这些厂商大多支持在官网免费下载字体,但需注意仅可个人使用,商用需要付费。

识别中文字体的用处

对于设计师和视频创作者而言,合适的中文字体对于作品风格有着重要、甚至一锤定音的影响。当你想模仿苹果风的视频,却不知选用何种字体,出来的效果就会「没内味」。

Apple 官方宣传片与 B 站 UP 主仿作的比较。图自 bilibili

使用一款合适的字体,可以极大降低文字方面的设计量,同时不输设计感。

感觉「冲顶珠峰」潇洒坚劲?这其实是电脑字体来的,设置一下就行。图自 方正字库
电脑字体来的,设置一下就行。图自 人民日报微博
电脑字体来的,设置一下就行。图自 上首造字

当然,如此轻松也是有代价的,那就是商用得花钱。对于某宝、某东的店家,如果你用了侵权字体而不自知,就有可能被律师函伺候。

此外,如果你足够熟悉中文字体,还有一些意想不到的妙用,例如识别假文物等等。

马未都分享的「道光通宝」疑似使用了现代电脑楷体。合成图,微博内容截图自 马未都微博
「脑残者无药医也」采用了与上下文显著不同的现代仿宋体。图源网络,原作者不详
从笔画边缘特征来看,作者是用画图 P 了几行微软雅黑的字。图源 小红书

这是电脑字库吗

在开始正餐之前,需要打一剂预防针:不是你看到的所有字都是电脑字库。

  1. 商标、电影片名一般不会使用电脑字库,至少要经过设计,以规避版权问题。
  2. 带落款的商家招牌有可能是请书法家书写的。
  3. 每个字的大小相差过大,或笔画过于突出的,一般是手写而成。
  4. 七八十年代及更早的字体,除个别几款外,一般没有对应的电脑字库。

电脑字库中,每个字只有唯一的写法,这是手写很难做到的。因此,可以比较两个相同字是否完全相同,以获得大致的判断。这个判断未必完全准确,因为有的设计师会在电脑字库的基础上进行修改。

除此之外,任何工具也做不到百分之百的识别准确率。

字体识别流程

正菜来了!如果我们手头有字体需要识别,应该如何操作呢?

这个流程非常简单,只需要准备一张图片,一个可以联网的浏览器就可以了。

待识别图片的基本要求

  1. 背景不应过于复杂
  2. 字与字间的笔画不能重叠
  3. 笔画边缘应清晰锐利
  4. 图片中文字数量不宜过多,10字以内为宜

常见的字体识别网站

  1. 求字体网
  2. 识字体网
  3. 搜字体网
  4. 维权骑士字体识别

我一般使用前两个。

常规字体识别流程

各类字体识别网站的流程大同小异,以下以识字体网为例。

待识别的图片是三名宇航员回家的庆祝海报。

预处理

首先应只裁取待识别的区域。

使用「反相」调整文字黑白。待识别字体应为黑色。

使用「阈值」来调整文字边缘,「噪点」以移除文字外干扰项。

此时,「安」「到」「家」「感」的笔画仍与插画笔画相连,难以识别。但我们不必追求完美,有三个及以上单字易识别即可。如需达到完美状态,还需要在上传到识别网站前预先处理。

旋转、倾斜、翻转等工具,在手机拍摄的照片需要识别时非常有用。

易识别的单字应满足:

  1. 清晰完整的黑色
  2. 不与外界相连
  3. 扭曲、变形程度小
  4. 笔画粗细与视觉观感一致

拼字

当我们完成预处理进入下一步,网站会展示出它分割好的所有部件:

有的文字与外界相连,有的文字七零八落,有的文字是完整的。所谓拼字,就是把七零八落的字拼到一起。虽然有很多网站推出了自动拼字的功能,但大部分情况下我更习惯手动拼字。这里只有「觉」被分开了,只需将缺失的部分拖拽到一起即可:

填好所有易识别的文字,注意区分简体和繁体。

输入好,拖到下面点击「立即识别」,等待网站返回结果!

比较并确定字体

在识别结果页面,你可以调整字体字号,或者输入其他文字,比较候选字体与图片的差异。

识别过程非常顺利:「方正榜书行」与图片中的字体在笔画细节方面完全一致,基本可以确定是该款字体。你可以下载字体并安装,进而在电脑中使用这款字体了。不过,重要的话再说一遍:不要商用。

如果未能识别出字体,一般有如下可能:

  1. 不是电脑字库;
  2. 该电脑字库未公开发布;
  3. 字体识别网站未收录该字体;
  4. 待识别单字不符合前文「易识别单字」的要求。这一条是唯一有解的,那就是按照之前的要求预处理一下。

祝你好运,找到自己心心念念的字体!如果没有识别到字体,也可以到文章开头的贴子下留言。