鱼C论坛

 找回密码
 立即注册
查看: 2814|回复: 2

[已解决]请问为什么pdfplumber模块读取不到pdf内容

[复制链接]
发表于 2023-5-27 15:25:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import pdfplumber
with pdfplumber.open('E:/小学数学.pdf') as file:
    for i in file.pages:
        print(i.extract_text())
最佳答案
2023-5-27 16:59:35
可能是pdfplumber模块读取的PDF文件有问题。请考虑以下几个方面:

1. PDF文件本身是否损坏,建议使用其他软件打开看一下是否正常。

2. PDF文件被加密了,需要先解密才能读取内容。

3. PDF文件的某些页面不包含文本内容,因此pdfplumber不能提取出任何文字信息。您可以尝试在其他PDF文

件中运行代码以确认问题是否出现。

如果以上方法都无法解决问题,请尝试升级pdfplumber到最新版本,并确保使用正确的Python版本和依赖

项。

有用请设置最佳答案

小学数学.zip

468.04 KB, 下载次数: 1

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-5-27 15:25:50 | 显示全部楼层
可能是因为pdfplumber模块无法识别该PDF文件的排版格式或出现了错误。可以尝试使用其他PDF解析模块,或者检查PDF文件是否存在非标准化排版或加密等问题。同时也需要确保该PDF文件路径和名称的拼写、大小写是否正确无误。

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-5-27 16:59:35 | 显示全部楼层    本楼为最佳答案   
可能是pdfplumber模块读取的PDF文件有问题。请考虑以下几个方面:

1. PDF文件本身是否损坏,建议使用其他软件打开看一下是否正常。

2. PDF文件被加密了,需要先解密才能读取内容。

3. PDF文件的某些页面不包含文本内容,因此pdfplumber不能提取出任何文字信息。您可以尝试在其他PDF文

件中运行代码以确认问题是否出现。

如果以上方法都无法解决问题,请尝试升级pdfplumber到最新版本,并确保使用正确的Python版本和依赖

项。

有用请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-27 11:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表