编注(@Minja):写文章时常常需要援引,需要回溯。对于各种存档、剪藏工具的不满,让我萌发了自己制作电子书的想法。正好 @Spencerwoo 在这方面有着扎实的折腾能力,便摆脱他一起研究了一套简单易行的方法,并写成文章和诸位分享。

网络世界上有价值的文章虽然多,但不是每篇的阅读体验都尽如人意。如果想有一个优秀的文章阅读体验,至少要保证我们在阅读的文章:

  • 起码,没有碍眼的牛皮癣广告
  • 通常,排版统一,图片规范
  • 最好,方便对文中关键词进行检索

很多时候,我们都依赖于浏览器的阅读模式,或是 Pocket 和 RSS 客户端进行阅读。但是阅读模式没法后期整理,多数阅读服务的全文检索功能又需要付费,而且网上的文章说不定哪天就找不着了。或许,将文章以电子书的形式保存到本地,是一个更加便于回溯的选择。

若是我们在网上看到一部以网页形式存在的电子书,想在本地直接保存整个网页(俗称「剪藏」),那简直是大费周折。现有的网页剪藏工具不仅可能夹带上无用的、影响体验的广告和其他冗余区域,还可能丢失重要宝贵的内容。不仅如此,能够方便抓取图片、自定义保存至本地的文章样式的工具,更是几乎没有。所以,接下来给大家介绍一套免费制作个性化电子书的方法。

本文主要利用 Pandoc 这个开源工具,对于需要 MOBI 或 PDF 格式电子书的读者,文章后半部分也有简便的转换方法。

以 ePub 电子书为突破点

目前主流的电子书格式很多,但是本文主要推荐 ePub,它相对开放统用,和可以轻松转换成其他格式。

主流电子书格式

大家最为熟知的电子书格式或许是纯文本 TXT 格式,但是 TXT 之所以被称作「纯文本」,就是因为他不支持分章节、不支持图片、不支持封面、不支持超链接。为了让电子书有格式、有图片、有内容,当前常见的电子书通常都是 PDF、ePub 和 MOBI 这三种格式的。其中:

  • PDF:就是我们常见的刊物、文档的排版格式,能够最大程度的保证各种设备上文档样式的一致性,但是对小屏幕设备支持较差,很多时候都需要拖动放大才能看清内容。
  • ePub:一种基于 HTML 的电子书格式,其排版效果接近 PDF,但是对小屏设备支持的更好,可以适应屏幕尺寸自动排版,体积往往也比 PDF 小。
  • MOBI:是另外一种电子书的格式,也是 Kindle 上面的主流电子书格式。ePub 和 MOBI 这两个格式的文件往往可以无痛转换。

我们本篇文章的主要目的就是利用接下来要介绍的工具,自己制作一本内嵌图片、包含目录、清晰精美的电子书。相对而言,ePub 灵活性较好,目录、自定义排版一应俱全,也方便转换成其他两种格式,本文就从它切入。

制作出的电子书效果