900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > 用python把pdf文件转换为word文件

用python把pdf文件转换为word文件

时间:2019-07-08 08:48:49

相关推荐

用python把pdf文件转换为word文件

安装pip install pdf2docx:

pip install pdf2docx

如果安装过程出现报错,可能是版本匹配问题,先安装PyMuPDF这个库即可正常安装pip install PyMuPDF。

pip install PyMuPDF

安装好后,把需要转换的PDF文档放到和python代码同一个文件夹内。

python代码:

import osfrom pdf2docx import Converterdef pdf_docx():# 获取当前工作目录file_path = os.getcwd()# 获取所有文件files = os.listdir(file_path)# 遍历所有文件for file in files:# 过滤临时文件if '~$' in file:continue# 过滤非pdf格式文件if file.split('.')[-1] != 'pdf':continue# 获取文件名称file_name = file.split('.')[0]# pdf文件名称pdf_name = os.getcwd() + '\\' + file# docx文件名称docx_name = os.getcwd() + '\\' + file_name + '.docx'# 加载pdf文档cv = Converter(pdf_name)cv.convert(docx_name, start=0, end=12)cv.close()if __name__ == '__main__':pdf_docx()

start是pdf转换的起始页,end是结束页。如果不传入start和end这两个参数,默认就是从第一页转换到最后一页。也可以通过pages方法确定转换页数,方法为:cv.convert(docx_file, pages=[0,2, 5])

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。