python按层级找出xml文件的差异

2023-02-26 03:39:02Python021

python按层级找出xml文件的差异,第1张

使用Python可以按层级比较XML文件的差异，可以使用lxml包中的diff函数，允许指定差异深度，而深度需要根据两个XML文件的差异而定。另外还可以使用difflib库中的diff()函数，它返回XML文件树形结构差异，可以轻松实现层级比对。

difflib是python提供的比较序列(string list)差异的模块。实现了三个类：

1>SequenceMatcher 任意类型序列的比较 (可以比较字符串)

2>Differ 对字符串进行比较

3>HtmlDiff 将比较结果输出为html格式.

建议你使用SequenceMatcher比较器，给你个例子吧。

SequenceMatcher实例:

import difflib

from pprint import pprint

a = 'pythonclub.org is wonderful'

b = 'Pythonclub.org also wonderful'

s = difflib.SequenceMatcher(None, a, b)

print "s.get_matching_blocks():"

pprint(s.get_matching_blocks())

print "s.get_opcodes():"

for tag, i1, i2, j1, j2 in s.get_opcodes():

print ("%7s a[%d:%d] (%s) b[%d:%d] (%s)" % (tag, i1, i2, a[i1:i2], j1, j2, b[j1:j2]))

输出为：

s.get_matching_blocks():

[(1, 1, 14), (16, 17, 1), (17, 19, 10), (27, 29, 0)]

s.get_opcodes():

replace a[0:1] (p) b[0:1] (P)

equal a[1:15] (ythonclub.org ) b[1:15] (ythonclub.org )

replace a[15:16] (i) b[15:17] (al)

equal a[16:17] (s) b[17:18] (s)

insert a[17:17] () b[18:19] (o)

equal a[17:27] ( wonderful) b[19:29] ( wonderful)

SequeceMatcher(None,a,b)创建序列比较对象，将以a作为参考标准进行

Sequecematcher(None,b,a)创建序列比较对象，将以b作为参考标准进行

a,b表示待比较的两个序列，生成序列比较对象后，调用该对象的get_opcodes()方法，将返回一个元组(tag,i1,i2,j1,j2).tag表示序列分片的比较结果.i1,i2表示序列a的索引，j1,j2表示序列b的索引.

get_opcodes()返回元组(tag,i1,i2,j1,j2)的含义

这里假设题目里面提到的”单独两个JSON文件的比较方法“的函数是compare_two_files，它接受两个文件的文件名作为参数。

from pathlib import Path

def compare_two_folders(from_folder, to_folder):

from_folder = Path(from_folder)

to_folder = Path(to_folder)

for json_file in from_folder.glob('*.json'):

json_file_name = json_file.name

json_file_to_compare = to_folder / f'a{json_file_name}'

compare_tow_files(json_file, json_file_to_compare)

序列差异文件层级对象

# 上一篇：怎么用python求一个数的平方？

# 下一篇：c语言中n--和--n是什么意思

给您推荐相同类型的内容：

Ruby构造日期对象和计算日期间天数差的问题
我写了个程序你看一下不明白的话联系我有注释#获取当前的时间today = Time.newputs "当前日期：" + today.strftime("%Y-%m-%d %H:%M:%S")#
python几种遍历复杂网站的方法原理是什么
python网络爬虫原理互联网网页可以看成是一张超大图,每个网页是一个节点,网页中指向其他网页的链接是边。那么,可以这样实现全网网页收集:以某一个网页为起点,下载并处理该网页,解析里面的链接,所得的URL加入下载队列。这个过程其实就是图的遍
RWBY的角色介绍
1，Ruby RoseRWBY队长，亦是本作的主角。有点天然呆，好奇心旺盛，并且敢于尝试各种大胆新奇的事物。古道热肠、富有正义感，对外人保持着友善关怀的心，能轻易打开胸怀接纳每一个人成为朋友和伙伴。很崇拜猎人和他们的生涯，并期望自己在将
在python中使用内置函数什么和什么可以查看并输出局部变量和全局变量列表？
要在 Python 中查看和打印局部变量和全局变量的列表，可以使用和内置函数。这些函数返回一个字典，分别包含当前作用域中所有局部变量和全局变量的名称和值。然后，您可以使用字典的方法循环访问键值对并将其打印到输出中。locals()glo
请问bordeaux port 2001红葡萄酒价格是多少？
红葡萄酒阿根廷 2004 博迪优马贝克 FINCA EL PORTILLO MALBEC 113.00 鉴赏白葡萄酒阿根廷 2004 高丽雅霞多丽特浓情 CALLIA CHARDONNAYTORRONTES 105.00 鉴
Python用循环语句,计算1+4+7+10+……..+1000+1001？
可以使用 for 循环语句来实现这个功能。代码如下：sum = 0# 用于存储和# 从1开始循环，每次加3for i in range(1, 1002, 3):sum += iprint(sum)# 打印计算结果上面的代码中，我们使
asm是C语言的关键字吗
asm是C语言的关键字，用于在C语言中嵌入汇编指令，例如：main（）｛asm mov ah,2asm mov bh,0asm mov dl, 20asm mov dh,10asm int 10h*调用BIOS中断设置光标位置*
求：中国石油大学（华东）现代远程教育 C语言在线考试答案
1.从键盘输入10个整数，求其和。#include &ltstdio.h&gtmain(){int i,x,s=0printf("请输入10个整数：")for(i=0i&lt10i++){
ruby wooz怎么读
ruby wooz，读音参考如下：物比午兹（兹可以不发音）补充：ruby美[ˈrubi]英[ˈruːbi]n.红宝石，镶红宝石的，红宝石色adj.红宝石色的lipstick lpstk口红复数形式lipsticks但
Mac重装+初始化配置
据我所知的重装Mac系统的方法有三种：具体的操作方式可以在网上查，本人懒一点，再加上网速还可以，就用了最省事的在线重装。首先我就安装了Xcode，吃饭的家伙，必须要先保证有。然后安装了搜狗输入法、Clean My Mac、有道
用python 画一个网格
print 函数是输出字符串，所以用 print 输出形成的 grid 其实质是具有某特定形状的字符串，而 plt.grid() 绘制出的网格是图片。字符串是可以用文字处理软件（如 word、记事本等）直接编辑处理的，而图片则
rush是什么东西？
1、意思：v. 冲；仓促行事；突袭；奔；急速流动n. 抢购；匆忙；冲进；急速行进；蜂拥adj. 繁忙的；紧急的2、发音：英 [rʌʃ] 　　美 [rʌʃ]3、用法：rush的基本意思是“(使)急速行动”“仓促完成”，指突然移动
这是什么漫画跪求好心人告诉我
《RWBY》（中译：四色）是一部在2013年7月播出的动画。R、W、B、Y 分别是英语红白黑黄的首字母，代表的分别是四位女主角的主题色。由美国Rooster Teeth动画工作室RWBY团队制作，导演Monty Oum。目前第一季已完结。简
为什么在安装ruby后找不到gem这个命令？
1.从图形界面启动 Linux 终端。2.在命令行输入 su，回车。然后输入 root 用户密码（注意意，屏幕上不显示），回车，登入 root 用户。3.在命令行输入 gedit etcprofile，回车。这样就打开了一个文本编辑
为什么Ruby语言在TIOBE上的排名一路下滑
我这几天也在研究ruby，我的结论是ruby有些特性，导致它难以实现比较好用的ide，这个严重影响了他的推广，调试和测试完全不依赖工具不可想象，ruby本身的思想还是挺优秀的，但是我不太建议真的用它做东西除非你真的对语言本身很熟练了ruby
python一个汉字的长度是多少？
这要看使用的哪种编码方式，utf-8的话是用了3个字节，GBK的话是用了两个&gt&gt&gt '汉'.encode('utf-8')b'xe6xb1x89&
ruby on rails怎么使用redis
对于在Rails上使用Redis Store，首先我们需要在Gemfile文件中添加入口gem 'redis-rails'gem 'redis-rack-cache' # optional然后我们就会
c语言中n--和--n是什么意思
1，C语言中可以使用两个很特别的单目运算符，这两个运算符是：++ 、-- “++”称为自增运算符，“--”称为自减运算符。它们既可以出现在运算对象的前面，如++N；又可以出现在运算对象的后面，如N++。前者称为前缀运算符，后者称为后缀运算符
如何在R语言中读入数据和导出存储数据
1.R数据的保存与加载可通过save()函数保存为.Rdata文件，通过load()函数将数据加载到R中。[ruby] view plain copy&gt a &lt- 1:10&gt save(a,file
学ruby用什么软件实现编程
推荐用Eclipse+RDT也可以用RadRails，整合了RDT和而且带有其它独有插件www.aptana.comproductsradrailsdownload不是吧？还有小伙伴不知道有些工具在敲代码时候超级好用，下面就给大家详细
ruby rose 是什么牌子
鲁比·洛斯 (Ruby Rose) 全名Ruby Rose Langenheim，是澳大利亚MTV音乐电视台主持人、电台DJ、模特，更是少数公开出柜的明星之一。鲁比·洛斯 (Ruby Rose) 是那种可以冷艳性感也可以中性帅气的美女，她的
用C语言编写一个通讯录管理系统
C语言编写一个通讯录管理系统的源代码如下：#include&ltstdio.h&gt#include&ltstring.h&gt#include&ltstdlib.h&gt*定义保存
新手，python怎么模拟网页按钮点击
首页，我们先理解网页点击的本质：其实，站在数据底层理解，我们对网页的操作可以抽象成向服务器发送数据。这样看来，我们有两种方法使用Python模拟网页按钮点击：方法一：间接模拟。模拟向服务器发送数据。可以用抓包工具，看点击按钮时到底向服务器发
用C语言编写一个通讯录管理系统
C语言编写一个通讯录管理系统的源代码如下：#include&ltstdio.h&gt#include&ltstring.h&gt#include&ltstdlib.h&gt*定义保存
c语言中％d什么意思
c语言中%d表示输入或输出十进制有符号数。C语言是一门面向过程的、抽象化的通用程序设计语言，广泛应用于底层开发。C语言能以简易的方式编译、处理低级存储器。C语言是仅产生少量的机器语言以及不需要任何运行环境支持便能运行的高效率程序设计语言。
保时捷白色车漆不同型号
普通漆，金属漆，特殊漆首先说命名，有直译，例如Macan3新增的龙胆蓝，GentianBlue！有音译，例如帕派雅橙，PApaya 是木瓜，好像西安有个夜店也叫这名儿上世纪50年代开始，光是红色就有很多种，356开始，有帕莎红（Pascha
DCM的简介
DCM全体投资团队有丰富的经验，而且随时准备着帮助DCM投资的企业家们。DCM的合伙人和董事们曾在不少成功的高科技公司创业或担任高级管理职位，包括苹果电脑，Arrow Electronics，F5网络公司，惠普公司，IBM，Intuit，K
Python正则表达式中re.M 是什么意思
Python正则表达式中re.M的意思是：多行匹配，影响 ^ 和 $。正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成
python怎么把输入变彩色
使用转义序列这个方法就可以实现彩色字符的转化。具体操作步骤分为两种情况：win7版本下，应使用python标准库提供的colorama模块。这个模块是跨平台的，因此内部实现也是采用转义序列这个原理来显示颜色的，只不过对windows
c语言中％d什么意思
%d是用来输出十进制整型数据的实际长度输出；%c是以字符形式输出，只输出一个字符；%f是以小数形式输出单、双精度度数，隐含输出6位小数。C语言包含的数据类型广泛，不仅包含有传统的字符型、整型、浮点型、数组类型等数据类型，还具有其他编程语言

推荐阅读

热门文章

最新发布

标签列表

python按层级找出xml文件的差异

给您推荐相同类型的内容：