最新发布

# 2023-02-09
华为的鸿蒙系统是是什么语言开发的？
根据华为公布的方舟编译器资料，可以得知鸿蒙系统是用C、C++语言编写。鸿蒙系统和方舟编译器的思路是一样：直接使用机器语言编写app，取消安卓系统的ART虚拟机，直接编译为二进制机器码；这样的好处是：不需要中转，执行速度快；劣势是：必须要
# 2023-02-09
华为怎么取消harmony系统
harmonyOS系统是可以退出的。HarmonyOS版本可以通过华为手机助手回退到EMUI 11.0官方稳定版本。注意事项：1. 请确保当前使用的是华为官方版本，且为HarmonyOS版本，并且未进行任何非官方版本
# 2023-02-09
鸿蒙抄袭安卓？看这一篇就够了
01什么是 AOSP ？很多人都说鸿蒙是 AOSP 套壳，那么我们首先得明白什么是 AOSP？ AOSP 是"Android Open Source Project&
# 2023-02-09
荣耀机型开启HarmonyOS 2内测，另有17款华为机型即将启动
目前，可以说华为自主研发的鸿蒙HarmonyOS系统正在如火如荼地开展升级及测试工作，而作为华为曾经的子品牌荣耀品牌的机型很多小伙伴都在期待获得HarmonyOS 2的测试，而最新消息来了，荣耀机型开启HarmonyOS内测了。根据最
# 2023-02-09
HarmonyOS赋能HUAWEI WATCH 3系列：隐私安全再升级
当前智能可穿戴设备已经慢慢渗透到我们的生活当中，有更多人愿意借助可穿戴设备来监测身体的各项数据与指标，从而更好的保护自己的身体。而华为作为可穿戴设备的头部厂商，凭借优质的硬件，丰富的软件及生态服务，受到了广大消费者的青睐。根据IDC《中国
# 2023-02-09
华为三款新机上市：预装HarmonyOS系统，但不支持5G，3699元起
大家都知道现在的手机市场主要还以5G手机为主，但深受芯片限制的华为也不得不再把4G手机拿出来“炒冷饭”。今日零点，华为多款4G新机正式开售，分别是华为Mate40 Pro 4G、Mate40E 4G以及nova8 Pro 4G。在5G
# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
如何升级Harmony OS？
首先，您需要了解升级Harmony OS前的准备工作：1.升级前，请确保设备没有被Root，并预留10G以上的内部存储空间。2.进入华为应用市场，搜索我的华为，将我的华为应用更新到最新版本。请提前备份好数据（第三方通讯类应用需单独备份），
# 2023-02-09
华为手机开机显示Harmony OS是什么情况?
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
创维电视能不能升级鸿蒙系统
创维电视不能升级鸿蒙系统目前只有华为智慧屏和荣耀智慧屏搭载了鸿蒙系统，而鸿蒙系统刚刚正式发布，创维还没有正式加入鸿蒙阵营，短期内不会为创维电视适配鸿蒙系统，所以目前创维电视是无法升级鸿蒙系统的。由于鸿蒙系统是完全开源的系统，基于安卓系统的智

python实现PDF文档间对比（百度文本识别接口）

2023-02-27 18:23:02Python014

python实现PDF文档间对比（百度文本识别接口）,第1张

一、原理

1、将PDF文档每页转换为图像

2、调用百度通用文本识别页面接口，对图像进行内容识别

3、对图像内容进行对比，并将对比不一致的内容在文档图像上进行标记（红框）

4、将对比结果表格输出为html，以便进行识别

二、范围和限制

1、目前仅支持PDF文档之间的对比

2、无法识别图形（盖章和logo）、不清晰字迹

3、需要联网使用（OCR使用的是百度通用文本识别接口，仅限测试使用，暂不限次数）

4、对比存在误差（原因为百度OCR识别无法达到100%准确）

三、安装库

pip install pymupdf

pip install requests

四、参数

originPDF: PDF文档原件路径

contrastPDF: PDF文档扫描件路径

resultRoot: 输出结果路径（提示：程序运行后会清空该目录，请不要直接设置桌面）

输出 : 标注差异的文档图像、Html文档

五、源码

六、执行结果示例：

这个是因为，你少了一个break 。可以这么理解：因为咱是按行跟行比较的，第一层循环取第一行，第二层循环，取第一行比较，不管比较的结果如何，这两个FOR都必须往下走到下一行。但是你的程序，如果相等，就跳出，比较下一行，如果不相等，继续用第一个FOR的值，跟第二个FOR的下一个值比较。简单说，就是当不相等的时候，一直用第一个FOR的值，跟第二个FOR的所有值比较，比较完才跳出循环。

if linea!=lineb:

n=n+1

print "在第%d行不一致" %(row)

print "123 is %s" %(linea)

print "122 is %s" %(lineb)

break

else:

break

difflib是python提供的比较序列(string list)差异的模块。实现了三个类：

1>SequenceMatcher 任意类型序列的比较 (可以比较字符串)

2>Differ 对字符串进行比较

3>HtmlDiff 将比较结果输出为html格式.

建议你使用SequenceMatcher比较器，给你个例子吧。

SequenceMatcher实例:

import difflib

from pprint import pprint

a = 'pythonclub.org is wonderful'

b = 'Pythonclub.org also wonderful'

s = difflib.SequenceMatcher(None, a, b)

print "s.get_matching_blocks():"

pprint(s.get_matching_blocks())

print

print "s.get_opcodes():"

for tag, i1, i2, j1, j2 in s.get_opcodes():

print ("%7s a[%d:%d] (%s) b[%d:%d] (%s)" % (tag, i1, i2, a[i1:i2], j1, j2, b[j1:j2]))

输出为：

s.get_matching_blocks():

[(1, 1, 14), (16, 17, 1), (17, 19, 10), (27, 29, 0)]

s.get_opcodes():

replace a[0:1] (p) b[0:1] (P)

equal a[1:15] (ythonclub.org ) b[1:15] (ythonclub.org )

replace a[15:16] (i) b[15:17] (al)

equal a[16:17] (s) b[17:18] (s)

insert a[17:17] () b[18:19] (o)

equal a[17:27] ( wonderful) b[19:29] ( wonderful)

SequeceMatcher(None,a,b)创建序列比较对象，将以a作为参考标准进行

Sequecematcher(None,b,a)创建序列比较对象，将以b作为参考标准进行

a,b表示待比较的两个序列，生成序列比较对象后，调用该对象的get_opcodes()方法，将返回一个元组(tag,i1,i2,j1,j2).tag表示序列分片的比较结果.i1,i2表示序列a的索引，j1,j2表示序列b的索引.

get_opcodes()返回元组(tag,i1,i2,j1,j2)的含义

序列文档对比结果图像

# 上一篇：HTML语言中,设置背景颜色的代码是？

# 下一篇：go语言中的面向对象