有时候我们需要把较多的图片转为一个 PDF 文件,提供这个功能的软件可能需要收费;在线图片转 PDF 工具可能限制图片数量且存在数据安全隐患。利用python,我们可以轻松实现将图片转换为 PDF,一起来看看怎么实现吧。

一、程序思路

程序的流程图如图1,思路是很简单清楚的:

图1:图片转PDF的程序流程图

二、所用到的python库

所用到的 python 库包括:

  • os:一个读取本地文件和目录的python模块,用来读取准备转为pdf的图片文件名。
  • PIL:一个图像处理的python模块,用来读取图片文件。
  • reportlab:一个可画图、画表格、编辑文字并输出PDF格式的python模块。用来生成pdf文件并绘制图片。

三、代码

首先 import 所需要的 python 模块。

import os
import PIL
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import landscape

现在开始“自下而上”地写程序所需要的函数。函数genpdf利用 reportlab 模块的 canvas 来实例化一个空白 PDF 对象,并指定 PDF 的文件名 "filename" 和尺寸 "pagesizes"这两个参数。

def genpdf(filename,pagesizes):
    pdf = canvas.Canvas(filename)
    pdf.setPageSize(pagesizes)
    return pdf

函数save_img_to_pdf向 PDF 对象写入一张图片,函数的参数包括 PDF 对象 "pdf",待绘入的图片 "image",图片在 PDF 页面中的位置 "x" 和 "y" 以及尺寸 "w" 和 "h",请参看图2的示意。

def save_img_to_pdf(pdf,image,x,y,w,h):
    pdf.drawImage(image,x,y,w,h)
    pdf.showPage()

 

图2:图片在 pdf 页面中的坐标和尺寸

在主程序中,我们用函数genpdf生成一个 PDF 对象;然后读取文件夹 "imageFolder"中的图片文件列表;对于列表中每一个图片文件,用函数save_img_to_pdf将图片绘制到 PDF 对象中。

if __name__ == '__main__':    
    pdf_size = (2480,3508)
    my_pdf = genpdf('my_pdf.pdf',pdf_size)
    folder = 'imgFolder'
    filelist = os.listdir(folder)
    for filename in filelist:
        img = PIL.Image.open(folder+'/'+filename)
        img_w,img_h = img.size
        img_x = (landscape(pdf_size)[1]-img_w)/2
        img_y = (landscape(pdf_size)[0]-img_h)/2
        save_img_to_pdf(my_pdf,folder+'/'+filename,x=img_x,y=img_y,w=img_w,h=img_h)
        print('image'+str(filename)+'saved.')
    my_pdf.save()

看看结果:imgFolder中的4张图片,被成功地转换为一个 PDF 文件中。

图3:imgFolder中的4张图片
图4:生成的 PDF 文件

代码中有几点值得留意:

1. 关于 PDF 对象的尺寸,即pdf_size参数。它存于一个tuple中,指定了生成的 PDF 的页面宽的像素点数和高的像素点数。注意应该让其大于图片的宽和高的像素点数(可在图片属性中查看,如图6),来保证图片能够完整绘入 PDF 中。

图5:在图片属性中查看图片的宽度和高度

2. 留意到我根据图片的 w 和 h 确定 x 和 y ,实现图片在 PDF 页面中的居中。

3. 关于文件的存放路径。本程序采用的都是相对路径,即:imgFolder文件夹位于python程序所在的目录下;程序所生成的 PDF 文件也会保存在此目录下。请参考图6。

图6:程序的相对路径

完整代码如下:

import os
import PIL
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import landscape

def genpdf(filename,pagesizes):
    pdf = canvas.Canvas(filename)
    pdf.setPageSize(pagesizes)
    return pdf

def save_img_to_pdf(pdf,image,x,y,w,h):
    pdf.drawImage(image,x,y,w,h)
    pdf.showPage()

if __name__ == '__main__':    
    pdf_size = (2480,3508)
    my_pdf = genpdf('my_pdf.pdf',pdf_size)
    folder = 'imgFolder'
    filelist = os.listdir(folder)
    for filename in filelist:
        img = PIL.Image.open(folder+'/'+filename)
        img_w,img_h = img.size
        img_x = (landscape(pdf_size)[1]-img_w)/2
        img_y = (landscape(pdf_size)[0]-img_h)/2
        save_img_to_pdf(my_pdf,folder+'/'+filename,x=img_x,y=img_y,w=img_w,h=img_h)
        print('image'+str(filename)+'saved.')
    my_pdf.save()

四、结语

这个将图片转为 PDF 的 python 程序是一个简单的 demo,它可以进一步完善的地方还有很多,比如:

  • 可以根据图片尺寸自动地确定 PDF 的尺寸?
  • 如何实现 PDF 转为图片?
  • ...

欢迎大家尝试和摸索,打造自己好用的 PDF 转换工具。