骑士123456 发表于 2024-1-30 00:11:54

为什么通过docx库删除word文档中几个段落出错?

原word文档内容如下:
“12345
abcde
ABCDE
一二三四五
甲乙丙丁戊”
我希望删除两个字母行,也就是第2、3行。我的代码如下:
from docx import Document
import os


def delete_paragraphs(docx, start_index, end_index):
    for i in range(start_index, end_index+1):
      p = docx.paragraphs._element
      p.getparent().remove(p)
      docx.paragraphs._p = docx.paragraphs._element = None

os.chdir('E:\\c')
docx = Document('111.docx')
delete_paragraphs(docx, 1, 2)# 删除第2到第3个段落
docx.save('111.docx')

运行以后打开文档显示如下:
“12345
ABCDE
甲乙丙丁戊”
删除的是第2、4行。
我用的是python3.6。
哪位大佬能为我解惑?不胜感激。

FishC 发表于 2024-1-30 00:12:30

你的代码中存在一个小错误,就是在删除段落时,没有正确获取要删除的段落。下面是修正后的代码:

from docx import Document

def delete_paragraphs(docx, start_index, end_index):
    paragraphs = docx.paragraphs# 获取要删除的段落
    for p in paragraphs:
      p._element.getparent().remove(p._element)# 删除段落的XML元素

docx = Document('111.docx')
delete_paragraphs(docx, 2, 3)# 删除第2到第3个段落
docx.save('111.docx')

修复的说明:
- 首先,我们用`docx.paragraphs`获取要删除的段落列表。注意,Python列表的索引是从0开始的,而你的索引是从1开始的,所以需要减去1。
- 然后,我们遍历要删除的段落列表,使用`p._element.getparent().remove(p._element)`删除段落的XML元素。

这样,你的代码就能正常删除指定的段落了。希望对你有帮助!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 为什么通过docx库删除word文档中几个段落出错?