python自动化-pdf文档操作

Python010

python自动化-pdf文档操作,第1张

使用第三方库

官方文档:pymupdf.readthedocs.io/en/latest/

提取图片的整体逻辑如下:

将每一页转换为一张张图片

安装pdf2image, github:github.com/Belval/pdf2…

安装:

使用库: github.com/2Dou/waterm…

步骤:

1.获得一个带水印pdf文件

1.1在图片添加水印,图片插入到word,word保存为pdf

1.2python处理:参考

github.com/2Dou/waterm…

mp.weixin.qq.com/s/_oJA6lbsd…

2.将水印pdf文件合并到源目标pdf文件的每一页

法1,直接在word,插入文本框,旋转,设置无边框,注意设置背景透明,然后复制多个。导出为pdf。

法2,word本身自己的增加水印,设计-水印-自定义文字或图片。缺点是只能是单个水印。

缺点是水印在内容pdf上方,如果设置过大,颜色不太透明,会遮挡内容。

解密:并不是破解,而是在已知密码的情况下解密

作者:秦与商

链接:https://juejin.cn/post/7069582991982329893

python删除打不开的pdf可以用以下方法:

1、python内要对pdf文件进行操作的话,一般都是使用PyPDF2这个第三方模块,而删除pdf页面则需要先将这个文件对象实例化到python中并且创建一个数据写入工具才可以来保存pdf文件。

2、使用for循环去迭代这个reader对象,这个reader对象还要调用getNumPages()方法,此方法的作用就是获取到这个pdf文件的页数,在循环之中创建一个空文档并且将获取到pdf页给写入。