[已解决]对比两份 xml 产生差异的部分

小白rog · 发表于 2023-10-11 16:05:42

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

对比两份 xml 产生差异的部分。file_diff_compare 无法跳过数字的差异部分

最佳答案

月排行榜 / 总排行榜

陶远航

2023-10-11 16:06:30

对比两份 XML 文件并产生差异部分的任务可以通过编程实现。这里提供一个 Python 的示例，使用 lxml 和 difflib 库来实现这个功能。注意，这个示例并不能跳过数字的差异部分，但你可以根据需要进行修改。

首先，你需要安装 lxml 和 difflib 库。你可以使用 pip 来安装：

pip install lxml difflib

复制代码

然后，你可以使用以下代码来对比两份 XML 文件：

from lxml import etree
import difflib
def compare_xml(file1, file2):
# 解析 XML 文件
tree1 = etree.parse(file1)
tree2 = etree.parse(file2)
# 将 XML 文件转换为字符串
xml1 = etree.tostring(tree1, pretty_print=True).decode()
xml2 = etree.tostring(tree2, pretty_print=True).decode()
# 使用 difflib 对比两个字符串
diff = difflib.unified_diff(xml1.splitlines(), xml2.splitlines())
# 打印出差异部分
for line in diff:
print(line)
# 使用函数对比两份 XML 文件
compare_xml('file1.xml', 'file2.xml')

复制代码

这个函数会打印出两份 XML 文件的差异部分。如果你想要跳过数字的差异部分，你需要在对比字符串之前，先将字符串中的数字替换掉。你可以使用正则表达式来实现这个功能。例如：

import re
# 将字符串中的数字替换为特定的字符串
xml1 = re.sub(r'\\d+', 'NUMBER', xml1)
xml2 = re.sub(r'\\d+', 'NUMBER', xml2)

复制代码

这样，对比的结果就不会包含数字的差异部分了。
请注意，本回答来自GPT-4
如果问题已经解决，请设置最佳答案

跳转到最佳答案楼层

isdkz · 发表于 2023-10-11 16:06:27

您可以使用XMLUnit库来比较两个XML文件并找出它们之间的差异。以下是使用XMLUnit库的示例代码：

import org.custommonkey.xmlunit.DetailedDiff;

import org.custommonkey.xmlunit.Diff;

import org.custommonkey.xmlunit.XMLUnit;

import org.xml.sax.SAXException;

import java.io.IOException;

import java.nio.file.Files;

import java.nio.file.Paths;

public class XmlDiff {

public static void main(String[] args) throws IOException, SAXException {

      // 读取两个XML文件

      String xml1 = new String(Files.readAllBytes(Paths.get("file1.xml")));

      String xml2 = new String(Files.readAllBytes(Paths.get("file2.xml")));

      // 配置XMLUnit库

      XMLUnit.setIgnoreWhitespace(true);

      XMLUnit.setIgnoreAttributeOrder(true);

      XMLUnit.setIgnoreComments(true);

      XMLUnit.setIgnoreDiffBetweenTextAndCDATA(true);

      // 比较XML文件

      Diff diff = new Diff(xml1, xml2);

      DetailedDiff detailedDiff = new DetailedDiff(diff);

      // 打印差异

      for (Object o : detailedDiff.getAllDifferences()) {

         System.out.println(o);

      }

}

}

复制代码

请注意，上述代码将忽略XML文件中的空格、属性顺序、注释和文本/ CDATA之间的差异。如果您想忽略数字的差异部分，您可以使用XMLUnit的NumberComparator类。

陶远航 · 发表于 2023-10-11 16:06:30

对比两份 XML 文件并产生差异部分的任务可以通过编程实现。这里提供一个 Python 的示例，使用 lxml 和 difflib 库来实现这个功能。注意，这个示例并不能跳过数字的差异部分，但你可以根据需要进行修改。

首先，你需要安装 lxml 和 difflib 库。你可以使用 pip 来安装：

pip install lxml difflib

复制代码

然后，你可以使用以下代码来对比两份 XML 文件：

from lxml import etree
import difflib
def compare_xml(file1, file2):
# 解析 XML 文件
tree1 = etree.parse(file1)
tree2 = etree.parse(file2)
# 将 XML 文件转换为字符串
xml1 = etree.tostring(tree1, pretty_print=True).decode()
xml2 = etree.tostring(tree2, pretty_print=True).decode()
# 使用 difflib 对比两个字符串
diff = difflib.unified_diff(xml1.splitlines(), xml2.splitlines())
# 打印出差异部分
for line in diff:
print(line)
# 使用函数对比两份 XML 文件
compare_xml('file1.xml', 'file2.xml')

复制代码

这个函数会打印出两份 XML 文件的差异部分。如果你想要跳过数字的差异部分，你需要在对比字符串之前，先将字符串中的数字替换掉。你可以使用正则表达式来实现这个功能。例如：

import re
# 将字符串中的数字替换为特定的字符串
xml1 = re.sub(r'\\d+', 'NUMBER', xml1)
xml2 = re.sub(r'\\d+', 'NUMBER', xml2)

复制代码

这样，对比的结果就不会包含数字的差异部分了。
请注意，本回答来自GPT-4
如果问题已经解决，请设置最佳答案

Mike_python小 · 发表于 2023-10-11 16:07:00

Python代码示例：比较两个XML文件的差异

你可以使用xml.etree.ElementTree模块来比较两个XML文件的差异。下面是一个示例代码：

import xml.etree.ElementTree as ET
def compare_xml_files(file1, file2):
root1 = ET.parse(file1).getroot()
root2 = ET.parse(file2).getroot()
def _compare_nodes(node1, node2):
if node1.tag != node2.tag:
yield f'Tag name mismatch: {node1.tag} != {node2.tag}'
return
for name, value in node1.attrib.items():
if name not in node2.attrib:
yield f'Attribute missing: {name}'
continue
if value != node2.attrib[name]:
yield f'Attribute value mismatch: {name}={value} != {node2.attrib[name]}'
for name in node2.attrib.keys():
if name not in node1.attrib:
yield f'Extra attribute: {name}'
if not (node1.text or '').strip() == (node2.text or '').strip():
yield f'Text content mismatch: {node1.text} != {node2.text}'
if not len(node1) == len(node2):
yield f'Children count mismatch: {len(node1)} != {len(node2)}'
for child1, child2 in zip(node1, node2):
yield from _compare_nodes(child1, child2)
yield from _compare_nodes(root1, root2)
# 比较文件1.xml和文件2.xml的差异
for diff in compare_xml_files('文件1.xml', '文件2.xml'):
print(diff)

复制代码

在上面的代码中，compare_xml_files函数接受两个XML文件的路径作为输入，并使用xml.etree.ElementTree模块来解析并遍历XML树。该函数定义了内部的_compare_nodes嵌套函数，根据节点的标签、属性、文本内容以及子节点分别比较两个XML文件中的对应节点。

如果存在差异，则将错误消息作为生成器(yield)的一部分返回，在外层循环中打印它们。

你可以根据需要修改该代码，例如将差异部分保存到文件中或者以其他形式进行展示。

希望以上代码能够满足你的需求。如果还有其他问题，请随时提问。

球一个最佳答案谢谢啦！这对我非常重要！

账号		自动登录	找回密码
密码			立即注册