为什么通过docx库删除word文档中几个段落出错？,Python交流,编程语言专区,鱼C论坛

骑士123456 发表于 2024-1-30 00:11:54

为什么通过docx库删除word文档中几个段落出错？

原word文档内容如下：
“12345
abcde
ABCDE
一二三四五
甲乙丙丁戊”
我希望删除两个字母行，也就是第2、3行。我的代码如下：
from docx import Document
import os

def delete_paragraphs(docx, start_index, end_index):
for i in range(start_index, end_index+1):
   p = docx.paragraphs._element
   p.getparent().remove(p)
   docx.paragraphs._p = docx.paragraphs._element = None

os.chdir('E:\\c')
docx = Document('111.docx')
delete_paragraphs(docx, 1, 2)# 删除第2到第3个段落
docx.save('111.docx')

运行以后打开文档显示如下：
“12345
ABCDE
甲乙丙丁戊”
删除的是第2、4行。
我用的是python3.6。
哪位大佬能为我解惑？不胜感激。

FishC 发表于 2024-1-30 00:12:30

你的代码中存在一个小错误，就是在删除段落时，没有正确获取要删除的段落。下面是修正后的代码：

from docx import Document

def delete_paragraphs(docx, start_index, end_index):
paragraphs = docx.paragraphs# 获取要删除的段落
for p in paragraphs:
p._element.getparent().remove(p._element)# 删除段落的XML元素

docx = Document('111.docx')
delete_paragraphs(docx, 2, 3)# 删除第2到第3个段落
docx.save('111.docx')

修复的说明：
- 首先，我们用`docx.paragraphs`获取要删除的段落列表。注意，Python列表的索引是从0开始的，而你的索引是从1开始的，所以需要减去1。
- 然后，我们遍历要删除的段落列表，使用`p._element.getparent().remove(p._element)`删除段落的XML元素。

这样，你的代码就能正常删除指定的段落了。希望对你有帮助！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

页: [1]

鱼C论坛's Archiver

为什么通过docx库删除word文档中几个段落出错？