鱼C论坛

 找回密码
 立即注册
查看: 2303|回复: 0

如何批量提取指定信息并输出到表格中汇总

[复制链接]
发表于 2022-8-11 17:26:26 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
大神们,我又来求助了,需求如下:

1、 要求。我需要提取指定公司年报中的“会计师事务所”的信息,如“事务所名称”、“事务所报酬”、“审计服务的连续年限”和“注册会计师姓名”等。
提取以上信息后,批量按照公司名称输入以上关键信息并形成EXCEL的二维表格。

2、我找了部分公司的信息,发现表格的表头基本为 “现聘任的会计师事务所”,然后我需要的信息就在表格当中,具体见图片。

3、提取思路,

①利用 pdfplumber 打开PDF 文件
②利用 .extract_text() 方法提取当前页的文字  链接:https://baijiahao.baidu.com/s?id ... r=spider&for=pc
③利用camelot从PDF文件中提取表格数据 链接:https://blog.csdn.net/weixin_39769675/article/details/110080319
④下面利用什么函数  可以提取转换后的数据并输入到表格当中(二维)

4、有没有更简单的方法,欢迎大佬来指正!!!
公司清单.jpg
提取信息.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-17 04:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表