hahadaxiao 发表于 2023-5-27 15:25:01

请问为什么pdfplumber模块读取不到pdf内容

import pdfplumber
with pdfplumber.open('E:/小学数学.pdf') as file:
    for i in file.pages:
      print(i.extract_text())

陶远航 发表于 2023-5-27 15:25:50

可能是因为pdfplumber模块无法识别该PDF文件的排版格式或出现了错误。可以尝试使用其他PDF解析模块,或者检查PDF文件是否存在非标准化排版或加密等问题。同时也需要确保该PDF文件路径和名称的拼写、大小写是否正确无误。

sfqxx 发表于 2023-5-27 16:59:35

可能是pdfplumber模块读取的PDF文件有问题。请考虑以下几个方面:

1. PDF文件本身是否损坏,建议使用其他软件打开看一下是否正常。

2. PDF文件被加密了,需要先解密才能读取内容。

3. PDF文件的某些页面不包含文本内容,因此pdfplumber不能提取出任何文字信息。您可以尝试在其他PDF文

件中运行代码以确认问题是否出现。

如果以上方法都无法解决问题,请尝试升级pdfplumber到最新版本,并确保使用正确的Python版本和依赖

项。

有用请设置最佳答案{:10_254:}
页: [1]
查看完整版本: 请问为什么pdfplumber模块读取不到pdf内容