为什么通过docx库删除word文档中几个段落出错?
原word文档内容如下:“12345
abcde
ABCDE
一二三四五
甲乙丙丁戊”
我希望删除两个字母行,也就是第2、3行。我的代码如下:
from docx import Document
import os
def delete_paragraphs(docx, start_index, end_index):
for i in range(start_index, end_index+1):
p = docx.paragraphs._element
p.getparent().remove(p)
docx.paragraphs._p = docx.paragraphs._element = None
os.chdir('E:\\c')
docx = Document('111.docx')
delete_paragraphs(docx, 1, 2)# 删除第2到第3个段落
docx.save('111.docx')
运行以后打开文档显示如下:
“12345
ABCDE
甲乙丙丁戊”
删除的是第2、4行。
我用的是python3.6。
哪位大佬能为我解惑?不胜感激。 你的代码中存在一个小错误,就是在删除段落时,没有正确获取要删除的段落。下面是修正后的代码:
from docx import Document
def delete_paragraphs(docx, start_index, end_index):
paragraphs = docx.paragraphs# 获取要删除的段落
for p in paragraphs:
p._element.getparent().remove(p._element)# 删除段落的XML元素
docx = Document('111.docx')
delete_paragraphs(docx, 2, 3)# 删除第2到第3个段落
docx.save('111.docx')
修复的说明:
- 首先,我们用`docx.paragraphs`获取要删除的段落列表。注意,Python列表的索引是从0开始的,而你的索引是从1开始的,所以需要减去1。
- 然后,我们遍历要删除的段落列表,使用`p._element.getparent().remove(p._element)`删除段落的XML元素。
这样,你的代码就能正常删除指定的段落了。希望对你有帮助!
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页:
[1]