最新发布

# 2023-02-09
harmonyos是什么意思
harmonyos即鸿蒙系统的意思，正确写法为harmony os。harmony os鸿蒙系统是华为公司在2019年8月9日于东莞举行华为开发者大会（HDC.2019）上正式发布的操作系统。鸿蒙系统面向全场景的分布式操作，将人、设备、
# 2023-02-09
华为HarmonyOS与安卓对比：鸿蒙系统的强大不止于此
自从HarmonyOS 2上线后，HarmonyOS优越的性能表现让大家眼前一亮，我认为该系统最大的优点就是可在后台打开多个大型游戏且能保持游戏不中断，即后台保活率高。据测评媒体@小白测评的实验数据显示搭载H
# 2023-02-09
华为手机开机显示Harmony OS怎么解决
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
harmonyos声音调到最大还是小怎么办
如果您的手机外放声音小，可以通过以下方法进行排查处理：1.请确保喇叭没有被遮挡请确保设备使用匹配的保护壳、保护套，避免喇叭的出音口位置被遮挡。2.更换播放音源或者播放APP后尝试3.提前备份好数据(QQ、微信等第三方应用需单独备份)更新版本
# 2023-02-09
鸿蒙OS2.0九大新功能，详细玩机技巧
鸿蒙OS适配后，相比EMUI新增了九大功能！赶快保存或者手机搜索玩机技巧。一、HarmonyOs 桌面提供了服务卡片、大文件夹与小艺建议,让操作更便捷、桌面更美观。服务卡片:无需打开应用,可快速预览应用信息或使用常用功能。将不同
# 2023-02-09
华为怎么取消harmony系统
harmonyOS系统是可以退出的。HarmonyOS版本可以通过华为手机助手回退到EMUI 11.0官方稳定版本。注意事项：1. 请确保当前使用的是华为官方版本，且为HarmonyOS版本，并且未进行任何非官方版本
# 2023-02-09
harmonyos是什么系统
华为harmonyos是鸿蒙系统。鸿蒙系统一款全新的面向全场景的分布式操作系统，创造一个超级虚拟终端互联的世界，将人、设备、场景有机地联系在一起，将消费者在全场景生活中接触的多种智能终端实现极速发现、极速连接、硬件互助、资源共享，用合适的设
# 2023-02-09
harmonyos是什么
harmonyos是华为鸿蒙系统。鸿蒙OS是华为公司开发的一款基于微内核、耗时10年、4000多名研发人员投入开发、面向5G物联网、面向全场景的分布式操作系统。鸿蒙的英文名是HarmonyOS，意为和谐。不是安卓系统的分支或修改而来的。与
# 2023-02-09
HarmonyOS——Ability和AbilitySlice生命周期(一)
HarmonyOS 中的页面会用到Ability和AbilitySlice。Ability是提供与用户交互的能力。AbilitySlice是一个页面及其逻辑的总和。两者的关系可以是一对多。也就是一个Ability中可以包含多个不同的A
# 2023-02-09
华为harmonyos 3有哪些特性?
华为harmonyos 3的特性：1、HarmonyOS 3体验更安全、更流畅HarmonyOS3系统会进一步打通各个设备之间的协同性，并且在系统性能表现和隐私安全上有所加强。HarmonyOS 3在安全性方面，新增了剪切板隐私保护、模糊

python文本对比

2023-02-28 14:01:02Python012

python文本对比,第1张

这个是因为，你少了一个break 。可以这么理解：因为咱是按行跟行比较的，第一层循环取第一行，第二层循环，取第一行比较，不管比较的结果如何，这两个FOR都必须往下走到下一行。但是你的程序，如果相等，就跳出，比较下一行，如果不相等，继续用第一个FOR的值，跟第二个FOR的下一个值比较。简单说，就是当不相等的时候，一直用第一个FOR的值，跟第二个FOR的所有值比较，比较完才跳出循环。

if linea!=lineb:

n=n+1

print "在第%d行不一致" %(row)

print "123 is %s" %(linea)

print "122 is %s" %(lineb)

break

else:

break

一、原理

1、将PDF文档每页转换为图像

2、调用百度通用文本识别页面接口，对图像进行内容识别

3、对图像内容进行对比，并将对比不一致的内容在文档图像上进行标记（红框）

4、将对比结果表格输出为html，以便进行识别

二、范围和限制

1、目前仅支持PDF文档之间的对比

2、无法识别图形（盖章和logo）、不清晰字迹

3、需要联网使用（OCR使用的是百度通用文本识别接口，仅限测试使用，暂不限次数）

4、对比存在误差（原因为百度OCR识别无法达到100%准确）

三、安装库

pip install pymupdf

pip install requests

四、参数

originPDF: PDF文档原件路径

contrastPDF: PDF文档扫描件路径

resultRoot: 输出结果路径（提示：程序运行后会清空该目录，请不要直接设置桌面）

输出 : 标注差异的文档图像、Html文档

五、源码

六、执行结果示例：

difflib是python提供的比较序列(string list)差异的模块。实现了三个类：

1>SequenceMatcher 任意类型序列的比较 (可以比较字符串)

2>Differ 对字符串进行比较

3>HtmlDiff 将比较结果输出为html格式.

建议你使用SequenceMatcher比较器，给你个例子吧。

SequenceMatcher实例:

import difflib

from pprint import pprint

a = 'pythonclub.org is wonderful'

b = 'Pythonclub.org also wonderful'

s = difflib.SequenceMatcher(None, a, b)

print "s.get_matching_blocks():"

pprint(s.get_matching_blocks())

print

print "s.get_opcodes():"

for tag, i1, i2, j1, j2 in s.get_opcodes():

print ("%7s a[%d:%d] (%s) b[%d:%d] (%s)" % (tag, i1, i2, a[i1:i2], j1, j2, b[j1:j2]))

输出为：

s.get_matching_blocks():

[(1, 1, 14), (16, 17, 1), (17, 19, 10), (27, 29, 0)]

s.get_opcodes():

replace a[0:1] (p) b[0:1] (P)

equal a[1:15] (ythonclub.org ) b[1:15] (ythonclub.org )

replace a[15:16] (i) b[15:17] (al)

equal a[16:17] (s) b[17:18] (s)

insert a[17:17] () b[18:19] (o)

equal a[17:27] ( wonderful) b[19:29] ( wonderful)

SequeceMatcher(None,a,b)创建序列比较对象，将以a作为参考标准进行

Sequecematcher(None,b,a)创建序列比较对象，将以b作为参考标准进行

a,b表示待比较的两个序列，生成序列比较对象后，调用该对象的get_opcodes()方法，将返回一个元组(tag,i1,i2,j1,j2).tag表示序列分片的比较结果.i1,i2表示序列a的索引，j1,j2表示序列b的索引.

get_opcodes()返回元组(tag,i1,i2,j1,j2)的含义

序列文档对比结果图像

# 上一篇：Go语言——goroutine并发模型

# 下一篇：电脑老是死机是什么原因