设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 编程语言专区 › Python交流 › 如何自动下载pdf

发新帖

查看: 4855|回复: 1

[已解决]如何自动下载pdf

发表于 2022-12-16 09:38:11 | 显示全部楼层 |阅读模式

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

网址：https://rd.gfqh.cn/RDInformation/article/3716。
想要实现获取每个pdf的链接，并进行下载，请教大佬们如何实现？

最佳答案

月排行榜 / 总排行榜

lxping

2022-12-16 23:33:52

import requests
import re
import io
p = re.compile(r'"download-box" data-url="(.+?)" data-name="(.+?.pdf)', re.S)
r = requests.get("https://rd.gfqh.cn/RDInformation/article/3716")
pdf_list = p.findall(r.text)
for i in range(len(pdf_list)):
pdf_text = requests.get(pdf_list[i][0])
bytes_io = io.BytesIO(pdf_text.content)
with open(pdf_list[i][1], "wb") as f:
f.write(bytes_io.getvalue())

复制代码

跳转到最佳答案楼层

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发表于 2022-12-16 23:33:52 | 显示全部楼层本楼为最佳答案

这个最佳答案由 lxping 给出，感谢 lxping 的回答。

单击隐藏图章

import requests
import re
import io
p = re.compile(r'"download-box" data-url="(.+?)" data-name="(.+?.pdf)', re.S)
r = requests.get("https://rd.gfqh.cn/RDInformation/article/3716")
pdf_list = p.findall(r.text)
for i in range(len(pdf_list)):
pdf_text = requests.get(pdf_list[i][0])
bytes_io = io.BytesIO(pdf_text.content)
with open(pdf_list[i][1], "wb") as f:
f.write(bytes_io.getvalue())

复制代码

小甲鱼最新课程 -> https://ilovefishc.com

回复支持 1 反对 0

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-7-31 12:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表