鱼C论坛

 找回密码
 立即注册
查看: 928|回复: 3

[已解决]对比两份 xml 产生差异的部分

[复制链接]
发表于 2023-10-11 16:05:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
对比两份 xml 产生差异的部分 。file_diff_compare 无法跳过数字的差异部分
最佳答案
2023-10-11 16:06:30
对比两份 XML 文件并产生差异部分的任务可以通过编程实现。这里提供一个 Python 的示例,使用 lxmldifflib 库来实现这个功能。注意,这个示例并不能跳过数字的差异部分,但你可以根据需要进行修改。

首先,你需要安装 lxmldifflib 库。你可以使用 pip 来安装:

  1. pip install lxml difflib
复制代码


然后,你可以使用以下代码来对比两份 XML 文件:

  1. from lxml import etree
  2. import difflib

  3. def compare_xml(file1, file2):
  4.     # 解析 XML 文件
  5.     tree1 = etree.parse(file1)
  6.     tree2 = etree.parse(file2)

  7.     # 将 XML 文件转换为字符串
  8.     xml1 = etree.tostring(tree1, pretty_print=True).decode()
  9.     xml2 = etree.tostring(tree2, pretty_print=True).decode()

  10.     # 使用 difflib 对比两个字符串
  11.     diff = difflib.unified_diff(xml1.splitlines(), xml2.splitlines())

  12.     # 打印出差异部分
  13.     for line in diff:
  14.         print(line)

  15. # 使用函数对比两份 XML 文件
  16. compare_xml('file1.xml', 'file2.xml')
复制代码


这个函数会打印出两份 XML 文件的差异部分。如果你想要跳过数字的差异部分,你需要在对比字符串之前,先将字符串中的数字替换掉。你可以使用正则表达式来实现这个功能。例如:

  1. import re

  2. # 将字符串中的数字替换为特定的字符串
  3. xml1 = re.sub(r'\\d+', 'NUMBER', xml1)
  4. xml2 = re.sub(r'\\d+', 'NUMBER', xml2)
复制代码


这样,对比的结果就不会包含数字的差异部分了。
请注意,本回答来自GPT-4
如果问题已经解决,请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-11 16:06:27 | 显示全部楼层
您可以使用XMLUnit库来比较两个XML文件并找出它们之间的差异。以下是使用XMLUnit库的示例代码:

  1. import org.custommonkey.xmlunit.DetailedDiff;
  2. import org.custommonkey.xmlunit.Diff;
  3. import org.custommonkey.xmlunit.XMLUnit;
  4. import org.xml.sax.SAXException;

  5. import java.io.IOException;
  6. import java.nio.file.Files;
  7. import java.nio.file.Paths;

  8. public class XmlDiff {

  9.     public static void main(String[] args) throws IOException, SAXException {
  10.         // 读取两个XML文件
  11.         String xml1 = new String(Files.readAllBytes(Paths.get("file1.xml")));
  12.         String xml2 = new String(Files.readAllBytes(Paths.get("file2.xml")));

  13.         // 配置XMLUnit库
  14.         XMLUnit.setIgnoreWhitespace(true);
  15.         XMLUnit.setIgnoreAttributeOrder(true);
  16.         XMLUnit.setIgnoreComments(true);
  17.         XMLUnit.setIgnoreDiffBetweenTextAndCDATA(true);

  18.         // 比较XML文件
  19.         Diff diff = new Diff(xml1, xml2);
  20.         DetailedDiff detailedDiff = new DetailedDiff(diff);

  21.         // 打印差异
  22.         for (Object o : detailedDiff.getAllDifferences()) {
  23.             System.out.println(o);
  24.         }
  25.     }
  26. }
复制代码


请注意,上述代码将忽略XML文件中的空格、属性顺序、注释和文本/ CDATA之间的差异。如果您想忽略数字的差异部分,您可以使用XMLUnit的NumberComparator类。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-11 16:06:30 | 显示全部楼层    本楼为最佳答案   
对比两份 XML 文件并产生差异部分的任务可以通过编程实现。这里提供一个 Python 的示例,使用 lxmldifflib 库来实现这个功能。注意,这个示例并不能跳过数字的差异部分,但你可以根据需要进行修改。

首先,你需要安装 lxmldifflib 库。你可以使用 pip 来安装:

  1. pip install lxml difflib
复制代码


然后,你可以使用以下代码来对比两份 XML 文件:

  1. from lxml import etree
  2. import difflib

  3. def compare_xml(file1, file2):
  4.     # 解析 XML 文件
  5.     tree1 = etree.parse(file1)
  6.     tree2 = etree.parse(file2)

  7.     # 将 XML 文件转换为字符串
  8.     xml1 = etree.tostring(tree1, pretty_print=True).decode()
  9.     xml2 = etree.tostring(tree2, pretty_print=True).decode()

  10.     # 使用 difflib 对比两个字符串
  11.     diff = difflib.unified_diff(xml1.splitlines(), xml2.splitlines())

  12.     # 打印出差异部分
  13.     for line in diff:
  14.         print(line)

  15. # 使用函数对比两份 XML 文件
  16. compare_xml('file1.xml', 'file2.xml')
复制代码


这个函数会打印出两份 XML 文件的差异部分。如果你想要跳过数字的差异部分,你需要在对比字符串之前,先将字符串中的数字替换掉。你可以使用正则表达式来实现这个功能。例如:

  1. import re

  2. # 将字符串中的数字替换为特定的字符串
  3. xml1 = re.sub(r'\\d+', 'NUMBER', xml1)
  4. xml2 = re.sub(r'\\d+', 'NUMBER', xml2)
复制代码


这样,对比的结果就不会包含数字的差异部分了。
请注意,本回答来自GPT-4
如果问题已经解决,请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-11 16:07:00 | 显示全部楼层
Python代码示例:比较两个XML文件的差异

你可以使用xml.etree.ElementTree模块来比较两个XML文件的差异。下面是一个示例代码:
  1. import xml.etree.ElementTree as ET
  2. def compare_xml_files(file1, file2):
  3.     root1 = ET.parse(file1).getroot()
  4.     root2 = ET.parse(file2).getroot()
  5.     def _compare_nodes(node1, node2):
  6.         if node1.tag != node2.tag:
  7.             yield f'Tag name mismatch: {node1.tag} != {node2.tag}'
  8.             return
  9.         for name, value in node1.attrib.items():
  10.             if name not in node2.attrib:
  11.                 yield f'Attribute missing: {name}'
  12.                 continue
  13.             if value != node2.attrib[name]:
  14.                 yield f'Attribute value mismatch: {name}={value} != {node2.attrib[name]}'
  15.         for name in node2.attrib.keys():
  16.             if name not in node1.attrib:
  17.                 yield f'Extra attribute: {name}'
  18.         if not (node1.text or '').strip() == (node2.text or '').strip():
  19.             yield f'Text content mismatch: {node1.text} != {node2.text}'
  20.         if not len(node1) == len(node2):
  21.             yield f'Children count mismatch: {len(node1)} != {len(node2)}'
  22.         for child1, child2 in zip(node1, node2):
  23.             yield from _compare_nodes(child1, child2)
  24.     yield from _compare_nodes(root1, root2)
  25. # 比较文件1.xml和文件2.xml的差异
  26. for diff in compare_xml_files('文件1.xml', '文件2.xml'):
  27.     print(diff)
复制代码

在上面的代码中,compare_xml_files函数接受两个XML文件的路径作为输入,并使用xml.etree.ElementTree模块来解析并遍历XML树。该函数定义了内部的_compare_nodes嵌套函数,根据节点的标签、属性、文本内容以及子节点分别比较两个XML文件中的对应节点。

如果存在差异,则将错误消息作为生成器(yield)的一部分返回,在外层循环中打印它们。

你可以根据需要修改该代码,例如将差异部分保存到文件中或者以其他形式进行展示。

希望以上代码能够满足你的需求。如果还有其他问题,请随时提问。

球一个最佳答案谢谢啦!这对我非常重要!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 06:08

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表