今天学习Django时,无意看到了pdf的报表类库Reportlab,使用该库可以很容易的生成pdf。其中介绍最多的是将图片转换为pdf,网上也有相关的介绍(Python Reportlab转换jpg为pdf),不过这些网上的介绍几乎全都是转自一篇博客的内容,代码是一模一样的。本来打算直接使用文章提供的代码,但发现改代码没有考虑图片尺寸与pdf只存之间的匹配,导致转换出来部分数据丢失。下面记录一下相应代码的修改过程:
一、基础知识
Reportlab是Python平台上优秀的报表类库,由于不属于python的标准类库,所以需要手动安装,下载地址:/software/downloads/。由于涉及到图片处理,还需要安装Python imaging library(PIL)类库。Reportlab库和PIL库下载完成后直接安装即可(建议先安装PIL库)。安装完成后,可以在python shell下执行import reportlab.pdfgen命令来测试是否安装正确。
python图像处理库——PIL,用于处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。
二、代码实现
代码使用图片如下:
1、网上版本:
#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
def convert_to_pdf(filename):
newname=filename[:filename.rindex('.')]+'.pdf'
w,h=landscape(A4)
c=canvas.Canvas(newname,pagesize=(w,h))
c.drawImage(filename,0,0,w,h)
c.save()
c.showPage()
print "convert finish"
由于Reportlab的Canvas画布的大小默认是A4大小,所以网上程序代码只是从图片中截取了A4大小的部分来生成pdf,导致图片很长或很宽时生成的图片比例失调。因此我们需要修改代码来适应不同尺寸的图片。
ps:landscape()函数的作用是获取A4大小的宽和高,Canvas()中第二个参数是一个宽和高组成的元祖用来表明生成pdf的大小。drawImage()函数的后四个参数用来指明图片在pdf中所占的区域,因此由于上面示例代码将图片放到了A4大小的区域中所以比例失调。
现在改进有两种方法:一是pdf画布大小仍是A4,只是将图片按照相应比例进行缩放;二是修改pdf画布的尺寸为图片的尺寸,即根据图片的大小来调整pdf的大小。、
2、改进方法1:pdf仍是A4大小,图片按相应比例进行缩放
#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
import Image
def convert_to_pdf1(filename):
im=Image.open(filename)
im_w,im_h=im.size
a4_w,a4_h=landscape(A4)
newname=filename[:filename.rindex('.')]+'.pdf'
c=canvas.Canvas(newname,pagesize=(a4_w,a4_h))
if a4_w/im_w
ratio=a4_w/im_w
else:
ratio=a4_h/im_h
c.drawImage(filename,0,0,im_w*ratio,im_h*ratio)
c.save()
c.showPage()
print "convert finish"
结果:
可以看到这次没有失真,只是由于图片太长了导致显示非常小。那我们尝试一下第二种改进方法:按照图片的大小来生成pdf
3、改进方法2:按照图片的大小来生成pdf
ps:按照图片大小来生成pdf的意思是按照图片的大小来生成画布。
#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
import Image
def convert_to_pdf2(filename):
im=Image.open(filename)
im_w,im_h=im.size
newname=filename[:filename.rindex('.')]+'.pdf'
c=canvas.Canvas(newname,pagesize=(im_w,im_h))
c.drawImage(filename,0,0,im_w,im_h)
c.save()
c.showPage()
print "convert finish"
convert_to_pdf2('a.jpg')
可以看到按照图片尺寸生成的pdf展示图片非常清晰,但是非常长,看起来比第一种改进方法要好一点。不过,如果要打印的话两种改进方法应该是一样的。
所以,最好的改进方法是能够将图片生成为多页pdf,而不是将其写进一页pdf中。如何改进还没想好。
———————————————————————————————————————–
参考代码:
使用python进行图像处理-调整图片大小
python有一个图像处理库——PIL,可以处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。
举个简单的例子,调整图片的大小:
infile = 'D:\\original_img.jpg'
outfile = 'D:\\adjust_img.jpg'
im = Image.open(infile)
(x,y) = im.size #read image size
x_s = 250 #define standard width
y_s = y * x_s / x #calc height based on standard width
out = im.resize((x_s,y_s),Image.ANTIALIAS) #resize image with high-quality
out.save(outfile)
print 'original size: ',x,y
print 'adjust size: ',x_s,y_s
'''
OUTPUT:
original size: 500 358
adjust size: 250 179
'''
参考资料:
1、python reportlab教程 /attachment/attach/25/97/97/88259797882a1b4c7c30fac1709f934f9e6ceac4f5.pdf
3、Python Reportlab转换jpg为pdf /kf/03/194306.html
4、使用python进行图像处理-调整图片大小 http://robin.sh/html/750_python-image-pil.html