python给pdf添加文本框

2023-02-25 20:02:01Python013

python给pdf添加文本框,第1张

1、使用阅读PDF，创建一个包含要使用ReportLab添加的文本的新pdf文件。

2、将其另存为字符串对象使用读取字符串对象。

3、使用创建一个新的PDF对象PdfFileWriter，将其称为输出遍历，输入内容并申请。

4、要添加文本的每个页面，用于修改后的页面添加到新文档中。Python由荷兰数学和计算机科学研究学会的吉多范罗苏姆于1990年代初设计，作为一门叫做ABC语言的替代品。

使用第三方库

官方文档：pymupdf.readthedocs.io/en/latest/

提取图片的整体逻辑如下：

将每一页转换为一张张图片

安装pdf2image, github:github.com/Belval/pdf2…

安装:

使用库： github.com/2Dou/waterm…

步骤:

1.获得一个带水印pdf文件

1.1在图片添加水印,图片插入到word,word保存为pdf

1.2python处理:参考

github.com/2Dou/waterm…

mp.weixin.qq.com/s/_oJA6lbsd…

2.将水印pdf文件合并到源目标pdf文件的每一页

法1，直接在word，插入文本框，旋转，设置无边框，注意设置背景透明，然后复制多个。导出为pdf。

法2，word本身自己的增加水印，设计-水印-自定义文字或图片。缺点是只能是单个水印。

缺点是水印在内容pdf上方，如果设置过大，颜色不太透明，会遮挡内容。

解密：并不是破解，而是在已知密码的情况下解密

作者：秦与商

链接：https://juejin.cn/post/7069582991982329893

一、原理

1、将PDF文档每页转换为图像

2、调用百度通用文本识别页面接口，对图像进行内容识别

3、对图像内容进行对比，并将对比不一致的内容在文档图像上进行标记（红框）

4、将对比结果表格输出为html，以便进行识别

二、范围和限制

1、目前仅支持PDF文档之间的对比

2、无法识别图形（盖章和logo）、不清晰字迹

3、需要联网使用（OCR使用的是百度通用文本识别接口，仅限测试使用，暂不限次数）

4、对比存在误差（原因为百度OCR识别无法达到100%准确）

三、安装库

pip install pymupdf

pip install requests

四、参数

originPDF: PDF文档原件路径

contrastPDF: PDF文档扫描件路径

resultRoot: 输出结果路径（提示：程序运行后会清空该目录，请不要直接设置桌面）

输出 : 标注差异的文档图像、Html文档

五、源码

六、执行结果示例：

水印文档内容图像对比

# 上一篇：Camille的《Ruby》歌词

# 下一篇：如何在Go语言中调用DLL

给您推荐相同类型的内容：

go语言method有没有继承顺序，实例探讨
计算机编程语言，尤其是面向对象的编程语言，虽然语法不同，但其原理大都是相通的！那么go语言的method方法的继承是否也有像python一样的顺序继承的机制呢？我们来用一个简单的实例探讨一下。因此，结论是go语言结构体（类）的继承并没有
c语言读取txt文件内容
用C语言从txt文件中读取数据，可以使用C标准库文件自带的文件接口函数进行操作。一、打开文件：FILE *fopen(const char *filename, const char *mode)因为txt文件为文本文件，所以打开时选择
python输入一个小时为单位的时间显示几小时几分钟
一小时六十分钟。输入一个有效的时间，并显示该时间设置时间格式为h：m：s，输入时保证输入且h、m、s的值有效，不然就抛出异常。Python是一种跨平台的计算机程序设计语言是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言最初被设
怎用C语言输入一个整数n和n个整数，输出其中的最大值？
是的,max=0是有问题的,如果输入的数都小于0,0就成为最大值了,而输入的数中没有0,这样显然不对.正确的做法是把第一个数赋给max,后面的数和max比较.完整的C语言程序如下(见图)如下：n--和--n的作用都是让n自减1，如原先
GO语言（十五）：泛型入门（下）-
在本节中，您将添加通用函数调用的修改版本，进行小的更改以简化调用代码。您将删除在这种情况下不需要的类型参数。当 Go 编译器可以推断您要使用的类型时，您可以在调用代码中省略类型参数。编译器从函数参数的类型推断类型参数。请
fitin18K玫瑰金金箍棒怎么用？泰国fitin黄金棒怎么样？
如何使用fitin18K玫瑰金金箍棒1.当时我以为是像refa一样手动碾压。后来才发现是电哈哈哈。像日本的金棒，可以转动底部开关，然后两个小轮子像马达一样转动？？？？按摩脸上很舒服！当然按摩肩膀缓解一下也没问题！2.我一般是早上脸肿的时
澳大利亚的鲁比.洛斯多高？
中文名：鲁比·洛斯英文名：Ruby Rose国籍：澳大利亚生日：1986年3月20日星座：双鱼座身份：DJ+超模+MTV主持人身高:173CMRuby Rose剪发视频《Break Free - Ruby Rose》中的背景音乐是Butte
怎样利用C语言编程求1!+3!+5!+……+N!的值？
#include&ltstdio.h&gtint main(){int n,ilong a,sum = 1printf("请输入一个奇数:n")scanf("%ld",&am
RWBY的角色介绍
1，Ruby RoseRWBY队长，亦是本作的主角。有点天然呆，好奇心旺盛，并且敢于尝试各种大胆新奇的事物。古道热肠、富有正义感，对外人保持着友善关怀的心，能轻易打开胸怀接纳每一个人成为朋友和伙伴。很崇拜猎人和他们的生涯，并期望自己在将
Go语言怎么样？
根据Go趋势报告显示，全球范围内有 110 万专业开发者选择Go作为其主要开发语言。如果把以其他编程语言作为主要开发语言，同时也在使用Go的开发者计算在内，这一数字将高达270万，中国的Go语言开发者排名第一，全球占比超过16%。Go 语
c语言变量基本类型有哪些
c语言的变量有三种类型:char,int,float,double其中char为字符类型的变量是八位的,最前一位作为符号位,后面七位作为数据位.它的存储范围在-128到127之间.int整数类型的变量是16位的,最前一位为符号位,后面的15
RUBY语言怎么判断指定目录是否存在
ruby中判断目录是否存在：File.directory?(argu)ruby文件操作：使用File类的静态方法，或者File类的实例对象 File类的静态方法File::atime(filename)返回指定文件的最后访问时间1.创建文件
小米Ruby怎么样，详细详细！谢谢
小米 (MI)Ruby 15.6英寸金属轻薄 FHD可以的哈，是他们才发布不久的新品，外观多时尚的，整体看着相当小巧精致的，质感蛮不错的，我有好几个朋友已经用上了，我自己也是才购不久的，外观是我喜欢的，然后手感不错，游戏一点儿也不卡，到现在
C语言面试题
C语言是一门通用计算机编程语言，应用广泛。C语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。下面就由我为大家介绍一下C语言面试题的文章，欢迎阅读。C语言面试题
ruby的英文读音
ruby 英文发音：['ruːbɪ]中文释义：n. 红宝石；红宝石色例句：I wonder what kind of ring he got her? He bought me a ruby.我想知道他给她买的什么样的戒
c语言到底有没有中文版的呀
C语言没有中文版,只有英文版.有些汉化的C也不是很稳定.C语言现在并不流行,有慢慢被淘汰的趋势.V.C就有中文版.你要是怕英语,最好别学编程,即使学的很好,在实际编程中也会遇到很多问题,出来找工作也很难找的.《CPrimerPlus(第6版
121 11 个案例掌握 Python 数据可视化--星际探索
星空是无数人梦寐以求想了解的一个领域，远古的人们通过肉眼观察星空，并制定了太阴历，指导农业发展。随着现代科技发展，有了更先进的设备进行星空的探索。本实验获取了美国国家航空航天局（NASA）官网发布的地外行星数据，研究及可视化了地外行星各参
QTpython环境是好的怎么调用项目外的.py文件？
直接就在这里面写也可以的，不用调用。网上多看Blog，博客园和CSDN上例子都有。我花了一周自学搞定了一个跟你类似的小项目。你一定要调用的话，import A from A这种就可以，参照：如何调用另一个.py文件中的类和函数我在学
为什么要使用 Go 语言？Go 语言的优势在哪里
1、学习曲线它包含了类C语法、GC内置和工程工具。这一点非常重要，因为Go语言容易学习，所以一个普通的大学生花一个星期就能写出来可以上手的、高性能的应用。在国内大家都追求快，这也是为什么国内Go流行的原因之一。2、效率Go拥有接近C的运行效
面试问题总结（一）Golang
使用go语言的好处: go语言的设计是务实的, go在针对并发上进行了优化, 并且支持大规模高并发, 又由于单一的码格式, 相比于其他语言更具有可读性, 在垃圾回收上比java和Python更有效, 因为他是和程序同时执行的.1.
c语言中n--和--n是什么意思
都是表示变量n的值自减（值-1）。区别：n--表示先取n的值再自减--n表示先自减再取n的值例如：int n=10printf("%d",n--) 打印的值是10 （执行完printf之后，n的值才变成9）int n=1
python库有哪些
Python比较常见的库有：Arrow、Behold、Click、Numba、Matlibplot、Pillow等：1、ArrowPython中处理时间的库有datetime，但是它过于简单，使用起来不够方便和智能，而Arrow可以说非
ruby是什么意思
ruby的汉语意思如下：n.红宝石深红色。adj.红宝石的红宝石色的。ruby的读音是：英 [ˈruːbi] 美 [ˈruːbi] 。ruby的造句如下：1、RDT is a far more full-featured Ru
Python脚本批量给文件添加内容
# -*- coding: utf-8 -*-import os def add_text(path,filepath:list): path_list = os.listdir(path) print(path_li
最简单的C语言代码
最简单的C语言代就是输出“helloWord”，通常是作为初学编程语言时的第一个程序代码。具体代码如下：#include &ltstdio.h&gtint main(){printf("Hello, World
vb和vc有什么最大的区别？
VB是一种解释型语言，需要VB的一个运行库来支持解释执行VB程序的；VC是一种编译型语言，源代码要经过编译器编译成exe可执行文件才能执行。二者区别：可视化：VC++的可视化没有VB的好。核心：VB的核心语言是Basc语言，VC的核语言
python圣诞树代码简单
```python# Python 圣诞树代码for i in range(1, 6): for j in range(1, i+1): print('*', end=' ') print('
python--目录操作
一、os.getcwd()获取当前工作目录，即当前Python脚本工作的目录路径。二、os. chdir(path)改变当前脚本工作目录；相当于shell下的cd命令。三、os.pardir返回当前目
c#和go语言的区别
c:面向过程，语法太麻烦c＃：面向对象（跟java很像如果你对java了解估计你就会明白c＆c＃之间的区别了），是ms.netframework的主力之一，它的代码运行是安全的，里面没有指针，像java一样有垃圾回收机制。语法基本没有区别，
如何在Go语言中调用DLL
关键是 lpOnRecvCardEvent 这个函数的第二个参数是个 C++ 指针。楼主在 C# 中声明这个导出函数时，使用了并不对应的 CardEvent[] C# 数组类型。正确的做法是：在 C# 声明 lpOnRecvCardE

推荐阅读

热门文章

最新发布

标签列表

python给pdf添加文本框

给您推荐相同类型的内容：