奔跑123456 发表于 2022-8-11 17:26:26

如何批量提取指定信息并输出到表格中汇总

大神们,我又来求助了,需求如下:

1、 要求。我需要提取指定公司年报中的“会计师事务所”的信息,如“事务所名称”、“事务所报酬”、“审计服务的连续年限”和“注册会计师姓名”等。
提取以上信息后,批量按照公司名称输入以上关键信息并形成EXCEL的二维表格。

2、我找了部分公司的信息,发现表格的表头基本为 “现聘任的会计师事务所”,然后我需要的信息就在表格当中,具体见图片。

3、提取思路,

①利用 pdfplumber 打开PDF 文件
②利用 .extract_text() 方法提取当前页的文字链接:https://baijiahao.baidu.com/s?id=1729347992449842761&wfr=spider&for=pc
③利用camelot从PDF文件中提取表格数据 链接:https://blog.csdn.net/weixin_39769675/article/details/110080319
④下面利用什么函数可以提取转换后的数据并输入到表格当中(二维)

4、有没有更简单的方法,欢迎大佬来指正!!!
页: [1]
查看完整版本: 如何批量提取指定信息并输出到表格中汇总